How to use
getContentStream
method
in
de.intarsys.pdf.pd.PDPage

Best Java code snippets using de.intarsys.pdf.pd.PDPage.getContentStream (Showing top 4 results out of 315)

private void tryImageExtraction(PDPage page, IDocearPdfImageHandler imageHandler) {
  CSImageExtractor ocrExtractor = new CSImageExtractor(imageHandler);
  CSDeviceBasedInterpreter interpreter = new CSDeviceBasedInterpreter(null, ocrExtractor);
  interpreter.process(page.getContentStream(), page.getResources());
}

private void extractText(PDPageTree pageTree, StringBuilder sb) {
  for (Iterator<?> it = pageTree.getKids().iterator(); it.hasNext();) {
    PDPageNode node = (PDPageNode) it.next();
    if (node.isPage()) {
      try {
        CSTextExtractor extractor = new CSTextExtractor();
        PDPage page = (PDPage) node;
        AffineTransform pageTx = new AffineTransform();
        PDFGeometryTools.adjustTransform(pageTx, page);
        extractor.setDeviceTransform(pageTx);
        CSDeviceBasedInterpreter interpreter = new CSDeviceBasedInterpreter(null, extractor);
        interpreter.process(page.getContentStream(), page.getResources());
        sb.append(extractor.getContent());
      } catch (CSException e) {
        e.printStackTrace();
      }
    } else {
      extractText((PDPageTree) node, sb);
    }
  }
}

gctx.fill(rect);
CSContent content = page.getContentStream();

private TreeMap<PdfTextEntity, StringBuilder> tryTextExtraction(PDPage page) {
  CSFormatedTextExtractor extractor = new CSFormatedTextExtractor();
              
  AffineTransform pageTx = new AffineTransform();
  PDFGeometryTools.adjustTransform(pageTx, page);
  extractor.setDeviceTransform(pageTx);
  CSDeviceBasedInterpreter interpreter = new CSDeviceBasedInterpreter(null, extractor);
  interpreter.process(page.getContentStream(), page.getResources());
  TreeMap<PdfTextEntity, StringBuilder> map = extractor.getMap();
  uniqueHash = extractor.getHash();
  return map;
}

Popular methods of PDPage

Popular in Java

Parsing JSON documents to java classes using gson
notifyDataSetChanged (ArrayAdapter)
setRequestProperty (URLConnection)
requestLocationUpdates (LocationManager)
EOFException (java.io)
Thrown when a program encounters the end of a file or stream during an input operation.
Runnable (java.lang)
Represents a command that can be executed. Often used to run code in a different Thread.
Date (java.sql)
A class which can consume and produce dates in SQL Date format. Dates are represented in SQL as yyyy
TreeMap (java.util)
Walk the nodes of the tree left-to-right or right-to-left. Note that in descending iterations, next
LogFactory (org.apache.commons.logging)
Factory for creating Log instances, with discovery and configuration features similar to that employ
Menu (java.awt)
Top plugins for WebStorm

How to use getContentStreammethodin de.intarsys.pdf.pd.PDPage

Best Java code snippets using de.intarsys.pdf.pd.PDPage.getContentStream (Showing top 4 results out of 315)

How to use
getContentStream
method
in
de.intarsys.pdf.pd.PDPage