How to use
LanguageModel
in
eu.monnetproject.translation

Best Java code snippets using eu.monnetproject.translation.LanguageModel (Showing top 11 results out of 315)

@Override
public int order() {
  return languageModel.getOrder();
}

@Override
public String getName() {
  return lm.getName();
}

@Override
public List<String> preCase(List<String> label) {
  if (lm != null) {
    final ListIterator<String> iter = label.listIterator();
    while (iter.hasNext()) {
      final String tokeni = iter.next();
      final String lowerCaseTk = tokeni.toLowerCase();
      if (!tokeni.equals(lowerCaseTk)) {
        final double origCaseScore = lm.score(Arrays.asList(tokeni));
        final double lowerCaseScore = lm.score(Arrays.asList(lowerCaseTk));
        if (!Double.isNaN(origCaseScore) && !Double.isNaN(lowerCaseScore)
            && !Double.isInfinite(origCaseScore) && !Double.isInfinite(lowerCaseScore)
            && lowerCaseScore - origCaseScore > 1.5) {
          iter.set(lowerCaseTk);
        }
      }
    }
  }
  return label;
}

public double lmProb(LanguageModel model, List<String> tokens) {
  double lmSumScore = 0.0;
  for (int pos = 0; pos < tokens.size(); pos++) {
    final int seqStart = Math.max(0, pos - model.getOrder() + 1);
    final List<String> ngram = new ArrayList<String>(tokens.subList(seqStart, pos + 1));
    final ListIterator<String> ngramIter = ngram.listIterator();
    while (ngramIter.hasNext()) {
      ngramIter.set(ngramIter.next().toLowerCase());
    }
    double ngramScore = model.score(ngram);
    if (ngramScore == Double.NEGATIVE_INFINITY || ngramScore != ngramScore) {
      lmSumScore += MOSES_LM_UNKNOWN_WORD_SCORE;
      continue;
    }
    lmSumScore += ngramScore;
  }
  return lmSumScore;
}

  @Override
  public boolean releventPrefix(Sequence<IString> sequence) {
    List<String> seq2 = new LinkedList<String>();
    for (int i = 0; i < sequence.size(); i++) {
      seq2.add(sequence.get(i).word());
    }
    return lm.isRelevantPrefix(seq2);
  }
}

  continue;
final int quartile = nGramSource.quartile(Arrays.asList(ngram));
if (quartile == 0 || quartile == 1) {
  botCount++;

  public static void main(String[] args) throws Exception {
    if(args.length != 1) {
      throw new IllegalArgumentException("Please specify language");
    }
    final LMFactory lmFactory = new LMFactory();
    final LanguageModel model = lmFactory.getModel(Language.get(args[0]));
    final BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
    String line;
    while((line = in.readLine()) != null) {
      System.out.println(model.score(Arrays.asList(line.split(" "))));
    }
  } 
}

@Override
public double[] get(Phrase phrase) {
  final List<String> ls = new ArrayList<String>(phrase.p.length);
  for (int i = 0; i < phrase.n; i++) {
    ls.add(invWordMap.get(phrase.p[i + phrase.l]));
  }
  final double[] score = new double[]{languageModel.score(ls)};
  if (Double.isInfinite(score[0]) || Double.isNaN(score[0])) {
    // Fallback case... try the lower-cased form
    final ListIterator<String> lsi = ls.listIterator();
    boolean differs = false;
    while (lsi.hasNext()) {
      final String s = lsi.next();
      if (s != null) {
        final String sl = s.toLowerCase();
        differs = (!s.equals(sl)) || differs;
        lsi.set(sl);
      }
    }
    if (differs) {
      return new double[]{languageModel.score(ls)};
    } else {
      return score;
    }
  } else {
    return score;
  }
}

@Override
public int order() {
  return lm.getOrder();
}

@Override
public double score(Sequence<IString> sequence) {
  List<String> seq2 = new LinkedList<String>();
  for (int i = 0; i < sequence.size(); i++) {
    seq2.add(sequence.get(i).word());
  }
  return lm.score(seq2);
}

public double percentUnigramsInLM(Translation translation) {
  final LanguageModel nGramSource = getModel(translation.getSourceLabel().getLanguage());
  if (nGramSource == null) {
    return 1.0;
  }
  final List<String> tokens = getTokens(translation.getSourceLabel());
  int count = 0;
  for (String s : tokens) {
    if (Double.isInfinite(nGramSource.score(Arrays.asList(s)))) {
      count++;
    }
  }
  return (double) (tokens.size() - count) / tokens.size();
}

Javadoc

A language model capable of estimating the probability of a phrase in a language

Most used methods

score
Score a sequence of tokens
getOrder
getName
isRelevantPrefix
quartile
Return the quartile of probability the token string belongs to

Popular in Java

Running tasks concurrently on multiple threads
setScale (BigDecimal)
getContentResolver (Context)
findViewById (Activity)
FileOutputStream (java.io)
An output stream that writes bytes to a file. If the output file exists, it can be replaced or appen
ConnectException (java.net)
A ConnectException is thrown if a connection cannot be established to a remote host on a specific po
URLConnection (java.net)
A connection to a URL for reading or writing. For HTTP connections, see HttpURLConnection for docume
BitSet (java.util)
The BitSet class implements abit array [http://en.wikipedia.org/wiki/Bit_array]. Each element is eit
Container (java.awt)
A generic Abstract Window Toolkit(AWT) container object is a component that can contain other AWT co
JComboBox (javax.swing)
Top 12 Jupyter Notebook extensions

How to useLanguageModel in eu.monnetproject.translation

Best Java code snippets using eu.monnetproject.translation.LanguageModel (Showing top 11 results out of 315)

How to use
LanguageModel
in
eu.monnetproject.translation