org.deeplearning4j.nn.conf.NeuralNetConfiguration$Builder.l2 java code examples

.weightInit(WeightInit.XAVIER)
.updater(new Nesterovs(0.1))// To configure: .updater(Nesterovs.builder().momentum(0.9).build())
.l2(1e-4)
.list()
.layer(0, new DenseLayer.Builder().nIn(28 * 28).nOut(500).build())

.l2(0.001)
.weightInit(WeightInit.XAVIER)
.updater(new RmsProp(0.1))

.weightInit(WeightInit.XAVIER)
.updater(new Nesterovs(0.02))// To configure: .updater(Nesterovs.builder().momentum(0.9).build())
.l2(1e-4)
.list()
.layer(0, new DenseLayer.Builder().nIn(28 * 28).nOut(500).build())

public void buildModel() {
  if (model == null) {
    int iterations = 1000;
    long seed = 6;
    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
        .seed(seed)
        .iterations(iterations)
        .activation(Activation.TANH)
        .weightInit(WeightInit.XAVIER)
        .learningRate(0.1)
        .regularization(true).l2(1e-4)
        .list()
        .layer(0, new DenseLayer.Builder().nIn(numInputs).nOut(3)
            .build())
        .layer(1, new DenseLayer.Builder().nIn(3).nOut(3)
            .build())
        .layer(2, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
            .activation(Activation.SOFTMAX)
            .nIn(3).nOut(numClasses).build())
        .backprop(true).pretrain(false)
        .build();
    //run the model
    model = new MultiLayerNetwork(conf);
    model.init();
    model.setListeners(iterationListener);
  }
}

public void buildModel() {
  if (model == null) {
    int iterations = 1000;
    long seed = 6;
    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
        .seed(seed)
        .iterations(iterations)
        .activation(Activation.TANH)
        .weightInit(WeightInit.XAVIER)
        .learningRate(0.1)
        .regularization(true).l2(1e-4)
        .list()
        .layer(0, new DenseLayer.Builder().nIn(numInputs).nOut(3)
            .build())
        .layer(1, new DenseLayer.Builder().nIn(3).nOut(3)
            .build())
        .layer(2, new OutputLayer.Builder(LossFunctions.LossFunction.MEAN_SQUARED_LOGARITHMIC_ERROR)
            .activation(Activation.SOFTMAX)
            .nIn(3).nOut(numClasses).build())
        .backprop(true).pretrain(false)
        .build();
    //run the model
    model = new MultiLayerNetwork(conf);
    model.init();
    model.setListeners(iterationListener);
  }
}

public void initializeBuilder(String... inputNames) {
  if (inputNames.length == 0) {
    inputNames = new String[]{"input"};
  }
  NeuralNetConfiguration.Builder graphBuilder = new NeuralNetConfiguration.Builder()
      .seed(args().seed)
      .iterations(1)
      .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
      .learningRate(args().learningRate)
      .updater(Updater.ADAGRAD)
      .epsilon(BUILDER_EPSILON)
      .lrPolicyDecayRate(0.5)
      .weightInit(WEIGHT_INIT);
  if (args().regularizationRate != null) {
    graphBuilder.l2(args().regularizationRate);
    graphBuilder.regularization(args().regularizationRate != null);
  }
  if (args().dropoutRate != null) {
    graphBuilder.dropOut(args().dropoutRate);
    graphBuilder.setUseDropConnect(true);
  }
  modelCapacity=args().modelCapacity;
  reductionRate=args().reductionRate;
  build = graphBuilder.graphBuilder().addInputs(inputNames);
}

  public MultiLayerConfiguration createNetwork() {
    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
        .seed(seed)
        .iterations(1)
        .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
        .learningRate(learningRate).regularization(regularization).l2(regularizationRate)
        .updater(Updater.ADAGRAD)
        .list()
        .layer(0, new DenseLayer.Builder().nIn(numInputs).nOut(numHiddenNodes)
            .weightInit(WEIGHT_INIT)
            .activation("relu").learningRateDecayPolicy(learningRatePolicy)
            .build())
        .layer(1, new DenseLayer.Builder().nIn(numHiddenNodes).nOut(numHiddenNodes)
            .weightInit(WEIGHT_INIT)
            .activation("relu").learningRateDecayPolicy(learningRatePolicy)
            .build())
        .layer(2, new OutputLayer.Builder(lossFunction)
            .weightInit(WEIGHT_INIT)
            .activation("softmax").learningRateDecayPolicy(learningRatePolicy)
            .nIn(numHiddenNodes).nOut(numOutputs).build())
        .pretrain(false).backprop(true).build();
    return conf;

  }
}

public MultiLayerConfiguration conf() {
  MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
          .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT).iterations(1)
          .learningRate(0.01).seed(12345).regularization(true).l2(0.001).weightInit(WeightInit.XAVIER)
          .updater(new RmsProp()).list()
          .layer(0, new GravesLSTM.Builder().nIn(inputShape[1]).nOut(256).activation(Activation.TANH)
                  .build())
          .layer(1, new GravesLSTM.Builder().nOut(256).activation(Activation.TANH).build())
          .layer(2, new RnnOutputLayer.Builder(LossFunctions.LossFunction.MCXENT)
                  .activation(Activation.SOFTMAX) //MCXENT + softmax for classification
                  .nOut(totalUniqueCharacters).build())
          .backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(50).tBPTTBackwardLength(50)
          .pretrain(false).backprop(true).build();
  return conf;
}

MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
  .seed(seed)
  .l2(0.0005)
  .weightInit(WeightInit.XAVIER)
  .updater(new Nesterovs.Builder().learningRate(.01).build())

.l2(0.001) //l2 regularization on all layers
.updater(new AdaGrad.Builder().learningRate(0.04).build())
.list()

MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
  .seed(seed)
  .l2(0.0005)
  .weightInit(WeightInit.XAVIER)
  .updater(new Nesterovs.Builder().learningRate(.01).build())

MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
  .seed(seed)
  .l2(0.0005)
  .weightInit(WeightInit.XAVIER)
  .updater(new Nesterovs.Builder().learningRate(.01).build())

.l2(0.001)
.weightInit(WeightInit.XAVIER)
.updater(new RmsProp.Builder().learningRate(0.1).build())

.l2(1e-5)
.weightInit(WeightInit.XAVIER)
.gradientNormalization(GradientNormalization.ClipElementWiseAbsoluteValue).gradientNormalizationThreshold(1.0)

.l2(1e-4)
.updater(new AMSGrad(lrSchedule))
.weightInit(WeightInit.RELU)

.optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
.regularization(true)
.l2(lambdaReg)
.list()
.layer(0, new CDAELayer.Builder().nIn(inputDim).nOut(hiddenDim)

.optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
.regularization(true)
.l2(lambdaReg)
.list()
.layer(0, new DenseLayer.Builder().nIn(inputDim).nOut(hiddenDim)

public static MultiLayerNetwork lenetModel() {
  /**
   * Revisde Lenet Model approach developed by ramgo2 achieves slightly above random
   * Reference: https://gist.github.com/ramgo2/833f12e92359a2da9e5c2fb6333351c5
   **/
  MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
      .seed(seed)
      .l2(0.005) // tried 0.0001, 0.0005
      .activation(Activation.RELU)
      .weightInit(WeightInit.XAVIER)
      .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
      .updater(new Nesterovs(0.0001,0.9))
      .list()
      .layer(0, new ConvolutionLayer.Builder(new int[]{5, 5}, new int[]{1, 1}, new int[]{0, 0}).name("cnn1")
          .nIn(channels).nOut(50).biasInit(0).build())
      .layer(1, new SubsamplingLayer.Builder(new int[]{2,2}, new int[]{2,2}).name("maxpool1").build())
      .layer(2, new ConvolutionLayer.Builder(new int[]{5,5}, new int[]{5, 5}, new int[]{1, 1}).name("cnn2")
          .nOut(100).biasInit(0).build())
      .layer(3, new SubsamplingLayer.Builder(new int[]{2,2}, new int[]{2,2}).name("maxpool2").build())
      .layer(4, new DenseLayer.Builder().nOut(500).build())
      .layer(5, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
          .nOut(4)
          .activation(Activation.SOFTMAX)
          .build())
      .backprop(true).pretrain(false)
      .setInputType(InputType.convolutional(height, width, channels))
      .build();
  return new MultiLayerNetwork(conf);
}

public static MultiLayerConfiguration lenetModelConf() {
  MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
      .seed(seed)
      .l2(0.005)
      .activation(Activation.RELU)
      .weightInit(WeightInit.XAVIER)
      .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
      .updater(new Nesterovs(0.0001, 0.9))
      .list()
      .layer(0, new ConvolutionLayer.Builder(new int[]{5, 5}, new int[]{1, 1}, new int[]{0, 0}).name("cnn1")
          .nIn(channels).nOut(50).biasInit(0).build())
      .layer(1, new SubsamplingLayer.Builder(new int[]{2,2}, new int[]{2,2}).name("maxpool1").build())
      .layer(2, new ConvolutionLayer.Builder(new int[]{5,5}, new int[]{5, 5}, new int[]{1, 1}).name("cnn2")
          .nOut(100).biasInit(0).build())
      .layer(3, new SubsamplingLayer.Builder(new int[]{2,2}, new int[]{2,2}).name("maxpool2").build())
      .layer(4, new DenseLayer.Builder().nOut(500).build())
      .layer(5, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
          .nOut(4)
          .activation(Activation.SOFTMAX)
          .build())
      .backprop(true).pretrain(false)
      .setInputType(InputType.convolutional(height, width, channels))
      .build();
  return conf;
}
public static void saveModel(FileSystem fs, Model model ) throws Exception{

  private static MultiLayerConfiguration getConfiguration(){
    int lstmLayerSize = 200;					//Number of units in each LSTM layer
    int tbpttLength = 50;                       //Length for truncated backpropagation through time. i.e., do parameter updates ever 50 characters

    Map<Character, Integer> CHAR_TO_INT = SparkLSTMCharacterExample.getCharToInt();
    int nIn = CHAR_TO_INT.size();
    int nOut = CHAR_TO_INT.size();

    //Set up network configuration:
    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
      .updater(new Nesterovs(0.1))
      .seed(12345)
      .l2(0.001)
      .weightInit(WeightInit.XAVIER)
      .list()
      .layer(0, new LSTM.Builder().nIn(nIn).nOut(lstmLayerSize).activation(Activation.TANH).build())
      .layer(1, new LSTM.Builder().nIn(lstmLayerSize).nOut(lstmLayerSize).activation(Activation.TANH).build())
      .layer(2, new RnnOutputLayer.Builder(LossFunctions.LossFunction.MCXENT).activation(Activation.SOFTMAX)        //MCXENT + softmax for classification
        .nIn(lstmLayerSize).nOut(nOut).build())
      .backpropType(BackpropType.TruncatedBPTT).tBPTTForwardLength(tbpttLength).tBPTTBackwardLength(tbpttLength)
      .pretrain(false).backprop(true)
      .build();

    return conf;
  }
}

Javadoc

L2 regularization coefficient for the weights. Use with .regularization(true)

Popular methods of NeuralNetConfiguration$Builder

<init>
updater
Gradient updater. For example, org.nd4j.linalg.learning.config.Adamor org.nd4j.linalg.learning.confi
list
Create a ListBuilder (for creating a MultiLayerConfiguration) with the specified layers Usage: .l
weightInit
Weight initialization scheme.
seed
Random number generator seed. Used for reproducability between runs
optimizationAlgo
Optimization algorithm to use. Most common: OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT
activation
Activation function / neuron non-linearity
iterations
Number of optimization iterations.
learningRate
Learning rate. Defaults to 1e-1
gradientNormalization
Gradient normalization strategy. Used to specify gradient renormalization, gradient clipping etc.
graphBuilder
Create a GraphBuilder (for creating a ComputationGraphConfiguration).
regularization
Whether to use regularization (l1, l2, dropout, etc

Popular in Java

Updating database using SQL prepared statement
getOriginalFilename (MultipartFile)
Return the original filename in the client's filesystem.This may contain path information depending
notifyDataSetChanged (ArrayAdapter)
onCreateOptionsMenu (Activity)
FileWriter (java.io)
A specialized Writer that writes to a file in the file system. All write requests made by calling me
Callable (java.util.concurrent)
A task that returns a result and may throw an exception. Implementors define a single method with no
Font (java.awt)
The Font class represents fonts, which are used to render text in a visible way. A font provides the
GridBagLayout (java.awt)
The GridBagLayout class is a flexible layout manager that aligns components vertically and horizonta
JComboBox (javax.swing)
Location (org.springframework.beans.factory.parsing)
Class that models an arbitrary location in a Resource.Typically used to track the location of proble
Top 12 Jupyter Notebook extensions

How to use l2methodin org.deeplearning4j.nn.conf.NeuralNetConfiguration$Builder

Best Java code snippets using org.deeplearning4j.nn.conf.NeuralNetConfiguration$Builder.l2 (Showing top 20 results out of 315)

How to use
l2
method
in
org.deeplearning4j.nn.conf.NeuralNetConfiguration$Builder