How to use
setStages
method
in
org.apache.spark.ml.Pipeline

Best Java code snippets using org.apache.spark.ml.Pipeline.setStages (Showing top 6 results out of 315)

LogisticRegression lr = new LogisticRegression().setMaxIter(100)
    .setRegParam(0.01);
Pipeline pipeline = new Pipeline().setStages(new PipelineStage[] {
    tokenizer, hashingTF, lr });
model = pipeline.fit(df);

/**
 * Creates a processing pipeline.
 * @return a pipeline
 */
protected Pipeline createPipeline() {
  Tokenizer tokenizer = new Tokenizer()
    .setInputCol("text")
    .setOutputCol("tokens");
  CountVectorizer countVectorizer = new CountVectorizer()
    .setInputCol("tokens")
    .setOutputCol("features")
    .setMinDF((Double)params.getOrDefault(params.getMinFF()))
    .setVocabSize((Integer)params.getOrDefault(params.getNumFeatures()));  
  StringIndexer transitionIndexer = new StringIndexer()
    .setInputCol("transition")
    .setOutputCol("label");
  
  Pipeline pipeline = new Pipeline().setStages(new PipelineStage[]{tokenizer, countVectorizer, transitionIndexer});
  return pipeline;
}

/**
 * Creates a processing pipeline.
 * @return a pipeline
 */
private Pipeline createPipeline() {
  Tokenizer tokenizer = new Tokenizer()
    .setInputCol("featureStrings")
    .setOutputCol("tokens");
  CountVectorizer countVectorizer = new CountVectorizer()
    .setInputCol("tokens")
    .setOutputCol("features")
    .setMinDF((Double)params.getOrDefault(params.getMinFF()))
    .setVocabSize((Integer)params.getOrDefault(params.getNumFeatures()));  
  StringIndexer tagIndexer = new StringIndexer()
    .setInputCol("tag")
    .setOutputCol("label");
  
  Pipeline pipeline = new Pipeline().setStages(new PipelineStage[]{tokenizer, countVectorizer, tagIndexer});
  return pipeline;
}

 @Test
 public void pipeline() {
  StandardScaler scaler = new StandardScaler()
   .setInputCol("features")
   .setOutputCol("scaledFeatures");
  LogisticRegression lr = new LogisticRegression()
   .setFeaturesCol("scaledFeatures");
  Pipeline pipeline = new Pipeline()
   .setStages(new PipelineStage[]{scaler, lr});
  PipelineModel model = pipeline.fit(dataset);
  model.transform(dataset).createOrReplaceTempView("prediction");
  Dataset<Row> predictions = spark.sql("SELECT label, probability, prediction FROM prediction");
  predictions.collectAsList();
 }
}

 @Test
 public void pipeline() {
  StandardScaler scaler = new StandardScaler()
   .setInputCol("features")
   .setOutputCol("scaledFeatures");
  LogisticRegression lr = new LogisticRegression()
   .setFeaturesCol("scaledFeatures");
  Pipeline pipeline = new Pipeline()
   .setStages(new PipelineStage[]{scaler, lr});
  PipelineModel model = pipeline.fit(dataset);
  model.transform(dataset).createOrReplaceTempView("prediction");
  Dataset<Row> predictions = spark.sql("SELECT label, probability, prediction FROM prediction");
  predictions.collectAsList();
 }
}

 @Test
 public void pipeline() {
  StandardScaler scaler = new StandardScaler()
   .setInputCol("features")
   .setOutputCol("scaledFeatures");
  LogisticRegression lr = new LogisticRegression()
   .setFeaturesCol("scaledFeatures");
  Pipeline pipeline = new Pipeline()
   .setStages(new PipelineStage[]{scaler, lr});
  PipelineModel model = pipeline.fit(dataset);
  model.transform(dataset).createOrReplaceTempView("prediction");
  Dataset<Row> predictions = spark.sql("SELECT label, probability, prediction FROM prediction");
  predictions.collectAsList();
 }
}

How to use setStagesmethodin org.apache.spark.ml.Pipeline

Best Java code snippets using org.apache.spark.ml.Pipeline.setStages (Showing top 6 results out of 315)

How to use
setStages
method
in
org.apache.spark.ml.Pipeline