How to use
org.tartarus.snowball.ext.RomanianStemmer
constructor

Best Java code snippets using org.tartarus.snowball.ext.RomanianStemmer.<init> (Showing top 9 results out of 315)

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new RomanianStemmer());
 return new TokenStreamComponents(source, result);
}

public RomanianSnowballStemmer() {
  super(new RomanianStemmer());
}
public Language getLanguage() { return Language.ROMANIAN; }

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new RomanianStemmer());
  }
};

static public TokenStream romanian(TokenStream result) {
  result = new LowerCaseFilter(result);
  result = new SnowballFilter(result, new RomanianStemmer());
  return result;
}

if(!stemExclusionSet.isEmpty())
 result = new SetKeywordMarkerFilter(result, stemExclusionSet);
result = new SnowballFilter(result, new RomanianStemmer());

  @Override
  public TokenStream getTokenStream(Tokenizer tokenizer, CharArraySet stemExclusionSet) {
    TokenStream stream = new StandardFilter(matchVersion, tokenizer);
    if (caseInsensitive)
      stream = new LowerCaseFilter(matchVersion, stream);
    if (useStopWords)
      stream = new StopFilter(matchVersion, stream, RomanianAnalyzer.getDefaultStopSet());
    if (useStem) {
      if (!stemExclusionSet.isEmpty())
        stream = new SetKeywordMarkerFilter(stream, stemExclusionSet);
      stream = new SnowballFilter(stream, new RomanianStemmer());
    }
    return stream;
  }
}

 /**
  * Creates a
  * {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  * which tokenizes all the text in the provided {@link Reader}.
  * 
  * @return A
  *         {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  *         built from an {@link StandardTokenizer} filtered with
  *         {@link StandardFilter}, {@link LowerCaseFilter}, {@link StopFilter}
  *         , {@link KeywordMarkerFilter} if a stem exclusion set is
  *         provided and {@link SnowballFilter}.
  */
 @Override
 protected TokenStreamComponents createComponents(String fieldName,
   Reader reader) {
  final Tokenizer source = new StandardTokenizer(matchVersion, reader);
  TokenStream result = new StandardFilter(matchVersion, source);
  result = new LowerCaseFilter(matchVersion, result);
  result = new StopFilter(matchVersion, result, stopwords);
  if(!stemExclusionSet.isEmpty())
   result = new KeywordMarkerFilter(result, stemExclusionSet);
  result = new SnowballFilter(result, new RomanianStemmer());
  return new TokenStreamComponents(source, result);
 }
}

return new SnowballFilter(tokenStream, new RomanianStemmer());

return new SnowballFilter(tokenStream, new RomanianStemmer());

How to use org.tartarus.snowball.ext.RomanianStemmerconstructor

Best Java code snippets using org.tartarus.snowball.ext.RomanianStemmer.<init> (Showing top 9 results out of 315)

How to use
org.tartarus.snowball.ext.RomanianStemmer
constructor