批量归一化 --- 使用Gluon

本章介绍如何使用Gluon在训练和测试深度学习模型中使用批量归一化。

定义模型并添加批量归一化层

有了Gluon，我们模型的定义工作变得简单了许多。我们只需要添加nn.BatchNorm层并指定对二维卷积的通道(axis=1)进行批量归一化。

from mxnet.gluon import nn

net = nn.Sequential()
with net.name_scope():
    # 第一层卷积
    net.add(nn.Conv2D(channels=20, kernel_size=5))
    ### 添加了批量归一化层 
    net.add(nn.BatchNorm(axis=1))
    net.add(nn.Activation(activation='relu'))
    net.add(nn.MaxPool2D(pool_size=2, strides=2))
    # 第二层卷积
    net.add(nn.Conv2D(channels=50, kernel_size=3))
    ### 添加了批量归一化层 
    net.add(nn.BatchNorm(axis=1))
    net.add(nn.Activation(activation='relu'))
    net.add(nn.MaxPool2D(pool_size=2, strides=2))
    net.add(nn.Flatten())
    # 第一层全连接
    net.add(nn.Dense(128, activation="relu"))
    # 第二层全连接
    net.add(nn.Dense(10))

模型训练

剩下的代码跟之前没什么不一样。

import sys
sys.path.append('..')
import utils
from mxnet import autograd 
from mxnet import gluon
from mxnet import nd
# from mxnet import init

ctx = utils.try_gpu()
net.initialize(ctx=ctx)

batch_size = 256
train_data, test_data = utils.load_data_fashion_mnist(batch_size)

softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.2})

for epoch in range(5):
    train_loss = 0.
    train_acc = 0.
    for data, label in train_data:
        label = label.as_in_context(ctx)
        with autograd.record():
            output = net(data.as_in_context(ctx))
            loss = softmax_cross_entropy(output, label)
        loss.backward()
        trainer.step(batch_size)

        train_loss += nd.mean(loss).asscalar()
        train_acc += utils.accuracy(output, label)
    test_acc = utils.evaluate_accuracy(test_data, net, ctx)
    print("Epoch %d. Loss: %f, Train acc %f, Test acc %f" % (
        epoch, train_loss/len(train_data), 
        train_acc/len(train_data), test_acc))

总结

使用Gluon我们可以很轻松地添加批量归一化层。

练习

如果在全连接层添加批量归一化结果会怎么样？

吐槽和讨论欢迎点这里

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

batch-norm-gluon.md

batch-norm-gluon.md

批量归一化 --- 使用Gluon

定义模型并添加批量归一化层

模型训练

总结

练习

Files

batch-norm-gluon.md

Latest commit

History

batch-norm-gluon.md

File metadata and controls

批量归一化 --- 使用Gluon

定义模型并添加批量归一化层

模型训练

总结

练习