How to use
getInstance
method
in
de.l3s.boilerpipe.extractors.ArticleExtractor

Best Java code snippets using de.l3s.boilerpipe.extractors.ArticleExtractor.getInstance (Showing top 3 results out of 315)

/**
 * {@inheritDoc}
 */
@Override
public String extractTextFromHtml(String html) throws Exception {
  return ArticleExtractor.getInstance().getText(html);
}

private String extractTextFromHtml(String text) throws BoilerpipeProcessingException {
  String extractedText;
  text = cleanHtml(text);
  extractedText = NumWordsRulesExtractor.getInstance().getText(text);
  if (extractedText != null && extractedText.length() > 0) {
    return extractedText;
  }
  extractedText = ArticleExtractor.getInstance().getText(text);
  if (extractedText != null && extractedText.length() > 0) {
    return extractedText;
  }
  return null;
}

private void loadDefaultRules() {
  addTextExtractor("default-extractor"      , PAGE_CONTENT_DE_PROPERTY , DefaultExtractor.getInstance());
  addTextExtractor("article-extractor"      , PAGE_CONTENT_AE_PROPERTY , ArticleExtractor.getInstance());
  addTextExtractor("large-content-extractor", PAGE_CONTENT_LCE_PROPERTY, LargestContentExtractor.getInstance());
  addTextExtractor("canola-extractor"       , PAGE_CONTENT_CE_PROPERTY , CanolaExtractor.getInstance());
}

Javadoc

Returns the singleton instance for ArticleExtractor.

Popular in Java

Making http post requests using okhttp
onCreateOptionsMenu (Activity)
notifyDataSetChanged (ArrayAdapter)
requestLocationUpdates (LocationManager)
BigInteger (java.math)
An immutable arbitrary-precision signed integer.FAST CRYPTOGRAPHY This implementation is efficient f
ConnectException (java.net)
A ConnectException is thrown if a connection cannot be established to a remote host on a specific po
PriorityQueue (java.util)
A PriorityQueue holds elements on a priority heap, which orders the elements according to their natu
ThreadPoolExecutor (java.util.concurrent)
An ExecutorService that executes each submitted task using one of possibly several pooled threads, n
GridBagLayout (java.awt)
The GridBagLayout class is a flexible layout manager that aligns components vertically and horizonta
GridLayout (java.awt)
The GridLayout class is a layout manager that lays out a container's components in a rectangular gri
Top Vim plugins

How to use getInstancemethodin de.l3s.boilerpipe.extractors.ArticleExtractor

Best Java code snippets using de.l3s.boilerpipe.extractors.ArticleExtractor.getInstance (Showing top 3 results out of 315)

How to use
getInstance
method
in
de.l3s.boilerpipe.extractors.ArticleExtractor