How to use
org.apache.lucene.analysis.ja.JapaneseKatakanaStemFilter
constructor

Best Java code snippets using org.apache.lucene.analysis.ja.JapaneseKatakanaStemFilter.<init> (Showing top 11 results out of 315)

  @Override
  public TokenStream create(TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream);
  }
}));

  @Override
  public TokenStream create(TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream, minimumLength);
  }
}

  @Override
  public TokenStream create(final TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream, minimumLength);
  }
}

  @Override
  public TokenStream create(TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream, minimumLength);
  }
}

 @Override
 public TokenStream create(TokenStream input) {
  return new JapaneseKatakanaStemFilter(input, minimumLength);
 }
}

  @Override
  public TokenStream create(TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream);
  }
}));

  @Override
  public TokenStream create(final TokenStream tokenStream) {
    return new JapaneseKatakanaStemFilter(tokenStream, minimumLength);
  }
}

 public TokenStream create(TokenStream stream) {
  return new JapaneseKatakanaStemFilter(stream);
 }
}

@Override
protected TokenStreamComponents createComponents(String fieldName) {
 Tokenizer tokenizer = new JapaneseTokenizer(userDict, true, mode);
 TokenStream stream = new JapaneseBaseFormFilter(tokenizer);
 stream = new JapanesePartOfSpeechStopFilter(stream, stoptags);
 stream = new CJKWidthFilter(stream);
 stream = new StopFilter(stream, stopwords);
 stream = new JapaneseKatakanaStemFilter(stream);
 stream = new LowerCaseFilter(stream);
 return new TokenStreamComponents(tokenizer, stream);
}

  @Override
  public TokenStream getTokenStream(Tokenizer tokenizer, CharArraySet stemExclusionSet) {
    TokenStream stream = new JapaneseBaseFormFilter(tokenizer);
    stream = new CJKWidthFilter(stream);
    if (caseInsensitive)
      stream = new LowerCaseFilter(matchVersion, stream);
    if (useStopWords) {
      stream = new JapanesePartOfSpeechStopFilter(true, stream, JapaneseAnalyzer.getDefaultStopTags());
      stream = new StopFilter(matchVersion, stream, JapaneseAnalyzer.getDefaultStopSet());
    }
    if (useStem)
      stream = new JapaneseKatakanaStemFilter(stream);
    return stream;
  }
}

 /**
  * Creates
  * {@link org.apache.lucene.analysis.util.ReusableAnalyzerBase.TokenStreamComponents}
  * used to tokenize all the text in the provided {@link Reader}.
  * 
  * @return {@link org.apache.lucene.analysis.util.ReusableAnalyzerBase.TokenStreamComponents}
  *         built from a {@link JapaneseTokenizer} filtered with
  *         {@link JapaneseWidthFilter}, {@link JapanesePunctuationFilter},
  *         {@link JapanesePartOfSpeechStopFilter}, {@link JapaneseStopFilter},
  *         {@link KeywordMarkerFilter} if a stem exclusion set is provided, 
  *         {@link JapaneseBasicFormFilter}, {@link JapaneseKatakanaStemFilter},
  *         and  {@link LowerCaseFilter}
  */
 @Override
 protected TokenStreamComponents createComponents(String field, Reader reader) {
  Tokenizer tokenizer = new JapaneseTokenizer(reader, null, dictionaryDir);
  TokenStream stream = new JapaneseWidthFilter(tokenizer);
  stream = new JapanesePunctuationFilter(true, stream);
  stream = new JapanesePartOfSpeechStopFilter(true, stream, stoptags);
  stream = new StopFilter(matchVersion, stream, stopwords);
  if (!stemExclusionSet.isEmpty())
   stream = new KeywordMarkerFilter(stream, stemExclusionSet);
  stream = new JapaneseBasicFormFilter(stream);
  stream = new JapaneseKatakanaStemFilter(stream);
  stream = new LowerCaseFilter(matchVersion, stream);
  return new TokenStreamComponents(tokenizer, stream);
 }
}

Popular methods of JapaneseKatakanaStemFilter

Popular in Java

Creating JSON documents from java classes using gson
scheduleAtFixedRate (Timer)
onCreateOptionsMenu (Activity)
getSharedPreferences (Context)
Charset (java.nio.charset)
A charset is a named mapping between Unicode characters and byte sequences. Every Charset can decode
Date (java.sql)
A class which can consume and produce dates in SQL Date format. Dates are represented in SQL as yyyy
ArrayList (java.util)
ArrayList is an implementation of List, backed by an array. All optional operations including adding
Collection (java.util)
Collection is the root of the collection hierarchy. It defines operations on data collections and t
List (java.util)
An ordered collection (also known as a sequence). The user of this interface has precise control ove
DateTimeFormat (org.joda.time.format)
Factory that creates instances of DateTimeFormatter from patterns and styles. Datetime formatting i
Github Copilot alternatives

How to use org.apache.lucene.analysis.ja.JapaneseKatakanaStemFilterconstructor

Best Java code snippets using org.apache.lucene.analysis.ja.JapaneseKatakanaStemFilter.<init> (Showing top 11 results out of 315)

How to use
org.apache.lucene.analysis.ja.JapaneseKatakanaStemFilter
constructor