CNN Example - Fully Connected Layers

现在你已经了解了几乎所有的用于创建一个完整的卷积神经网络的构件我们来看个例子假设输入图像大小为32323 一个RGB图像，或许你试着做手写数字识别例如，你有一个3232 RGB图像要尝试识别图像中是0-9中10个数字的哪一个是7 让我们创建一个神经网络来做这项工作这里中我将要使用的算法是受到了一种和它非常相似的经典的神经网络的启发称作LeNet-5 LeNet-5多年前由Yann LeCun创建这里我将要展示的和LeNet-5不完全一样，但其中许多参数的选择是受到它启发的这里有一个32323的输入，让我们用一个 55的过滤器，步长为1，无补丁生成第一层输出那么第一层输出是28286，假设使用了6个过滤器我们称这一层为conv 1 那么用了6个过滤器，加上偏差值，再应用非线性或许ReLU非线性，得到了卷积层一的输出接下来，让我们使用一个池化层这里我将使用最大池化，应用参数f=2，s=2 如果我没有写补丁参数，就意味补丁为零接下来让我们使用一个池化层假设我们用一个22的过滤器，步长为2做最大池化那么原有的高度和宽度将会缩小一半因此2828现在变成了1414 通道数量保持不变，所以大小为14146 我们把这层称之为池1输出事实上在卷积网文档中中有二种关于层的说法二者有细微的差别一种说法是这称为一层那么这二个单元一起成为神经网络的第一层另一种说法是卷积层称为一层，池化层单独称为一层神经网络中当人们说到网络层数的时候，通常指那些有权重，有参数的网络层数量因为池化层没有权重，没有参数只有一些超参数，我会使用卷积层1和池化层1为一体的说法把他们作为层一，尽管有时候当你看在线文章或读研究论文时，你会听到卷积层和池化层被称为两个独立层但这不过是二种细微不一致的表示术语这里当我计算层数，我只会算那些有权重的层所以我视这二个一起为层一并且Conv1和Pool1名字末尾是1 也表明了我认为二者都是神经网络层一的组成部分因为池化层1没有自己的权重，所以被并入层一接下来，在14146的基础上，让我们再做一层卷积，这次使用大小为55的过滤器并且步长为一，共10个过滤器那现在你会得到一个101010的单元称之为卷积层二然后我们继续做最大池化再次使用池化参数f=2，s=2 或许你已经了解了在此参数下输出的高度和宽度会减半所以剩下的是5510大小的这一步被称为池化层2 按照我们的说法这二个合称为神经网络层二接下来我们再使用一次卷积层我将会使用55大小的过滤器，那么f等于5 假设步长为1，且不做填充让我们使用16个过滤器，这样你会获得卷积层2的输出也就是101016大小的输出如图所示，这是卷积层二接着我们来做最大池化，假设f等于2，s等于2 你或许已经知道了结果在101016基础上做f等于2，s等于2的最大池化将会使输入高度和宽度减半你应该已经知道结果了，对吧用f等于2，s等于2做池化高度和宽度被减半，那么最终获得一个5516的单元，通道数保持不变我们称这块为池化层二按照我们的说法这块被称为层二由于只有卷积层二有权重这里5乘5乘16等于400 现在让我们把池化层二展开成一个4001的向量把它想象成如图所示的一组展开的神经元接下来我们要做的是用着400个单元做输入创建一个有120个单元的下一层这实际上是我们第一个全连接网络层我将称之为FC3 因为这400个输入单元和120输出单元密集的相连

因此这个全连接层和你在课程1和课程2所见到的单神经网络层一样这不过是一个标准神经网络，其中被称为w3的权重矩阵大小为120400 因为400个输入中的每一个单元都和120输出的每一个单元相连所以被称为全连接网，并且这里还有个偏差参数大小也将是120的向量，因为有120个输出最后一步让我们在120的单元基础上再加一层这次让它变得更小，假设我们有84个单元最终我将它称为全连接网络层4 最终我们获得了可以用于Softmax层的84个实数如果你是试着做手写数字识别来确定是0，1，2，直到9中的数字那这将是一个有着10个输出的Softmax层这就是一个相对典型的例子展示了一个卷积神经网络的大致构成我理解这其中似乎有许多超参数稍后我们将会给出一些更具体的建议关于如何选择这类超参数也许一个常用的法则实际上是不要试着创造你自己的超参数组而是查看文献，看看其他人使用的超参数从中选一组适用于其他人的超参数很可能它也适用于你的应用下周我们会做更多介绍目前我只想指出，通常随着神经网络的深入高度nh和宽度nw会减小如之前所示，从3232减到2020，1414 再到1010，最终减到55 因此当你深入下去通常高度和宽度将会减小然而通道数量会增加这里从3到6再到16，最后是全连通网络层另一类常见的神经网络模型是一个或多个卷积层接着一层池化层再接着一个或多个卷积层叠加一层池化层然后叠加几层全连接层也许最后还叠加一个Softmax层如上所述是另一个常见的神经网络模型那么让我们再回顾一下神经网络的一些细节如激活输入的尺寸，大小和网络参数数量这里输入为32323 这些数字相乘应该等于3072 所以激活输入a0的大小为3072 实际尺寸是32323 我认为输入层是没有参数的再看看接下来的不同层数据试着自己来算一算如表所示，这是不同层的激活输入的尺寸和大小

这里需要指出几点首先，注意最大池化没有任何参数其次，注意卷积层趋向于拥有越来越少的参数正如我们在早前的视频中所述实际上，多数参数在神经网络的全连接层上同时，随着神经网络的深入你会发现激活输入大小也逐渐变小如果减少的太快，通常也不利于网络性能这里首先大小从6000减到1600 接下来慢慢减小到84，直到最终得到softmax层的输出你会发现许多卷积神经网络有着与此相似的特性和模式到这里你已经了解了神经网络的基本构件卷积神经网络，卷积层，池化层和全连接层如何利用这些基本构件来构造一个有效的神经网络已经有许多计算机领域专家在深入研究了把这些构件组合到一起实际上需要相当的洞察力我认为最好的方法之一就是去学习一定数量的实例，看看人家是如何做的从中来获得灵感如何把这些构件组合在一起所以除了你现在看到的第一个实例，下周我将给你展示其他一些实例，看看大家是如何成功的用这些构件来创建很高效的神经网络通过下周的视频希望能帮到你获得一些关于如何构建神经网络的自己的想法而且既然已经给出了一些实例也许你可以直接在自己的应用程序中使用他人已经开发的构架下周我们再讲在本周收尾前，最后一点我想提一下接下来的视频我将浅谈一下为什么要用卷积使用卷积的好处和优点以及如何把他们组合在一起如何通过训练集来训练一个神经网络，如之前所见来做图像识别或者其他一些任务那么接下来让我们看看本周的最后一个视频

PreviousPooling Layers NextWhy Convolutions?

Last updated 6 years ago