org.deeplearning4j.nn.conf.MultiLayerConfiguration$Builder.pretrain java code examples

  .nIn(lstmLayerSize).nOut(nOut).build())
.backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(tbpttLength).tBPTTBackwardLength(tbpttLength)
.pretrain(false).backprop(true)
.build();

.inputPreProcessor(3, new CnnToFeedForwardPreProcessor(7, 7, 10))
.inputPreProcessor(4, new FeedForwardToRnnPreProcessor())
.pretrain(false).backprop(true)
.backpropType(BackpropType.TruncatedBPTT)
.tBPTTForwardLength(V_NFRAMES / 5)

  private static MultiLayerConfiguration getConfiguration(){
    int lstmLayerSize = 200;					//Number of units in each LSTM layer
    int tbpttLength = 50;                       //Length for truncated backpropagation through time. i.e., do parameter updates ever 50 characters

    Map<Character, Integer> CHAR_TO_INT = SparkLSTMCharacterExample.getCharToInt();
    int nIn = CHAR_TO_INT.size();
    int nOut = CHAR_TO_INT.size();

    //Set up network configuration:
    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
      .updater(new Nesterovs(0.1))
      .seed(12345)
      .l2(0.001)
      .weightInit(WeightInit.XAVIER)
      .list()
      .layer(0, new LSTM.Builder().nIn(nIn).nOut(lstmLayerSize).activation(Activation.TANH).build())
      .layer(1, new LSTM.Builder().nIn(lstmLayerSize).nOut(lstmLayerSize).activation(Activation.TANH).build())
      .layer(2, new RnnOutputLayer.Builder(LossFunctions.LossFunction.MCXENT).activation(Activation.SOFTMAX)        //MCXENT + softmax for classification
        .nIn(lstmLayerSize).nOut(nOut).build())
      .backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(tbpttLength).tBPTTBackwardLength(tbpttLength)
      .pretrain(false).backprop(true)
      .build();

    return conf;
  }
}

    .build())
.setInputType(InputType.convolutionalFlat(WIDTH, HEIGHT, 1))
.backprop(true).pretrain(false).build();

.backprop(true).pretrain(false).build();

.pretrain(pretrain).backpropType(backpropType).tBPTTForwardLength(tbpttFwdLength)
.tBPTTBackwardLength(tbpttBackLength).setInputType(this.inputType)
.trainingWorkspaceMode(globalConfig.trainingWorkspaceMode).cacheMode(globalConfig.cacheMode)

private void initHelperMLN() {
  if (applyFrozen) {
    org.deeplearning4j.nn.api.Layer[] layers = origMLN.getLayers();
    for (int i = frozenTill; i >= 0; i--) {
      //unchecked?
      layers[i] = new FrozenLayer(layers[i]);
    }
    origMLN.setLayers(layers);
  }
  for (int i = 0; i < origMLN.getnLayers(); i++) {
    if (origMLN.getLayer(i) instanceof FrozenLayer) {
      frozenInputLayer = i;
    }
  }
  List<NeuralNetConfiguration> allConfs = new ArrayList<>();
  for (int i = frozenInputLayer + 1; i < origMLN.getnLayers(); i++) {
    allConfs.add(origMLN.getLayer(i).conf());
  }
  MultiLayerConfiguration c = origMLN.getLayerWiseConfigurations();
  unFrozenSubsetMLN = new MultiLayerNetwork(new MultiLayerConfiguration.Builder().backprop(c.isBackprop())
          .inputPreProcessors(c.getInputPreProcessors()).pretrain(c.isPretrain())
          .backpropType(c.getBackpropType()).tBPTTForwardLength(c.getTbpttFwdLength())
          .tBPTTBackwardLength(c.getTbpttBackLength()).confs(allConfs).build());
  unFrozenSubsetMLN.init();
  //copy over params
  for (int i = frozenInputLayer + 1; i < origMLN.getnLayers(); i++) {
    unFrozenSubsetMLN.getLayer(i - frozenInputLayer - 1).setParams(origMLN.getLayer(i).params());
  }
  //unFrozenSubsetMLN.setListeners(origMLN.getListeners());
}

public MultiLayerConfiguration conf() {
  MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder().trainingWorkspaceMode(workspaceMode)
          .inferenceWorkspaceMode(workspaceMode).seed(seed).iterations(iterations)
          .activation(Activation.IDENTITY).weightInit(WeightInit.XAVIER)
          .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT).updater(new AdaDelta())
          .regularization(false).convolutionMode(ConvolutionMode.Same).list()
          // block 1
          .layer(0, new ConvolutionLayer.Builder(new int[] {5, 5}, new int[] {1, 1}).name("cnn1")
                  .nIn(inputShape[0]).nOut(20).activation(Activation.RELU).build())
          .layer(1, new SubsamplingLayer.Builder(SubsamplingLayer.PoolingType.MAX, new int[] {2, 2},
                  new int[] {2, 2}).name("maxpool1").build())
          // block 2
          .layer(2, new ConvolutionLayer.Builder(new int[] {5, 5}, new int[] {1, 1}).name("cnn2").nOut(50)
                  .activation(Activation.RELU).build())
          .layer(3, new SubsamplingLayer.Builder(SubsamplingLayer.PoolingType.MAX, new int[] {2, 2},
                  new int[] {2, 2}).name("maxpool2").build())
          // fully connected
          .layer(4, new DenseLayer.Builder().name("ffn1").activation(Activation.RELU).nOut(500).build())
          // output
          .layer(5, new OutputLayer.Builder(LossFunctions.LossFunction.MCXENT).name("output")
                  .nOut(numLabels).activation(Activation.SOFTMAX) // radial basis function required
                  .build())
          .setInputType(InputType.convolutionalFlat(inputShape[2], inputShape[1], inputShape[0]))
          .backprop(true).pretrain(false).build();
  return conf;
}

public MultiLayerConfiguration conf() {
  MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
          .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT).iterations(1)
          .learningRate(0.01).seed(12345).regularization(true).l2(0.001).weightInit(WeightInit.XAVIER)
          .updater(new RmsProp()).list()
          .layer(0, new GravesLSTM.Builder().nIn(inputShape[1]).nOut(256).activation(Activation.TANH)
                  .build())
          .layer(1, new GravesLSTM.Builder().nOut(256).activation(Activation.TANH).build())
          .layer(2, new RnnOutputLayer.Builder(LossFunctions.LossFunction.MCXENT)
                  .activation(Activation.SOFTMAX) //MCXENT + softmax for classification
                  .nOut(totalUniqueCharacters).build())
          .backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(50).tBPTTBackwardLength(50)
          .pretrain(false).backprop(true).build();
  return conf;
}

    .nIn(lstmLayerSize).nOut(nOut).build())
.backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(tbpttLength).tBPTTBackwardLength(tbpttLength)
.pretrain(false).backprop(true)
.build();

Javadoc

Whether to do pre train or not

Popular methods of MultiLayerConfiguration$Builder

backprop
Whether to do back prop or not
build
tBPTTBackwardLength
When doing truncated BPTT: how many steps of backward should we do? Only applicable when doing backp
tBPTTForwardLength
When doing truncated BPTT: how many steps of forward pass should we do before doing (truncated) back
backpropType
The type of backprop. Default setting is used for most networks (MLP, CNN etc), but optionally trunc
<init>
cacheMode
This method defines how/if preOutput cache is handled: NONE: cache disabled (default value) HOST: Ho
confs
inferenceWorkspaceMode
This method defines Workspace mode being used during inference: NONE: workspace won't be used SINGLE
inputPreProcessor
Specify the processors. These are used at each layer for doing things like normalization and shaping
inputPreProcessors
isPretrain

Popular in Java

Parsing JSON documents to java classes using gson
onRequestPermissionsResult (Fragment)
notifyDataSetChanged (ArrayAdapter)
setContentView (Activity)
EOFException (java.io)
Thrown when a program encounters the end of a file or stream during an input operation.
IOException (java.io)
Signals a general, I/O-related error. Error details may be specified when calling the constructor, a
Thread (java.lang)
A thread is a thread of execution in a program. The Java Virtual Machine allows an application to ha
GridBagLayout (java.awt)
The GridBagLayout class is a flexible layout manager that aligns components vertically and horizonta
Reflections (org.reflections)
Reflections one-stop-shop objectReflections scans your classpath, indexes the metadata, allows you t
Location (org.springframework.beans.factory.parsing)
Class that models an arbitrary location in a Resource.Typically used to track the location of proble
Top 12 Jupyter Notebook extensions

How to use pretrainmethodin org.deeplearning4j.nn.conf.MultiLayerConfiguration$Builder

Best Java code snippets using org.deeplearning4j.nn.conf.MultiLayerConfiguration$Builder.pretrain (Showing top 10 results out of 315)

How to use
pretrain
method
in
org.deeplearning4j.nn.conf.MultiLayerConfiguration$Builder