Deep L-layer neural network

欢迎大家来学习第四周的课程在之前的课程中我们学习了单隐藏层神经网络中的前向传播和反向传播逻辑回归我们还学习了向量化也了解了对权重参数进行随机初始化的重要性如果你完成了前几周的作业那你应该已经实现并亲眼看到了某些理念实现后的效果迄今为止我们已经学过实现深度神经网络需要的大部分知识本周的任务是把这些理念组合起来并利用它们实现你自己的深度神经网络完成本周的习题所需要的时间会比较长可能要多花一点心思我会压缩本周的视频课程让你观看视频的时间稍微短一些这样你就能有更多的时间去完成编程作业我希望这个作业可以加深你对神经网络的理解

并能得到一个让你引以为豪的深度学习模型到底什么是深度神经网络呢? 我们已经见过这个逻辑回归的结构图了也已经学习过单隐藏层的神经网络结构先来看一个例子这里有一个双隐层的神经网络模型还有一个含有5个隐藏层的神经网络模型我们一般会说逻辑回归是非常“浅”的模型而右下角这个模型的层数更深浅和深只是程度的区别这是单隐藏层的神经网络也就是2层神经网络要记住当我们计算神经网络的层数时不包括输入层我们只计算隐藏层和输出层所以这是2层神经网络它仍然比较浅但比逻辑回归要深一点从技术上来说逻辑回归是单层神经网络但是过去几年在人工智能领域机器学习社区认识到有一些函数只有很深的神经网络才能学习而比较浅的网络模型无法做到这点虽然对于任何特定的问题来说可能很难事先得知你需要多深的网络所以一般我们会先尝试逻辑回归然后再尝试一个两个隐藏层可以把隐藏层的数量作为另一个超参数你可以尝试很多不同的值然后通过交叉验证或者开发集进行评估之后我们会深入讨论现在我们来看看描述深度网络使用的符号这是一二三四四层神经网络

有三个隐藏层隐藏层中的单元数量是5 5 3 然后有一个输出单元我们使用大写的L来表示神经网络中的层数这里 L = 4 即层数为4 我们用n上标小写l来表示第l层上的单元数让我们来标上序号输入层是第0层这是第1层这是第2层这是第3层这是第4层然后我们可以得出 n[1] 的标记是这样的第一个隐藏层这儿 n[1]=5 因为在这儿有5个隐藏单元对于这个我们可以写成n[2] 代表第二个隐藏层中的单元数量也等于5 n[3] = 3 n[4] = n[L] 因为大写的L等于4 输出层的单元数为1 我们再来看看输入层输入层n[0] = nx = 3 这就是我们用来描述不同层中单元数的符号对于每一层l 我们还会使用 a[l]代表第l层中的激活函数之后我们会看到在前向传播的场景中你最后要计算的激活函数g(z[l])的结果a[l] 我们也可以用层数l来对激活函数进行标注另外我们用W[l]来表示计算第l层的中间值z[l]时使用的权重类似的 b[l]表示计算z[l]时用到的偏置参数最后我们来总结一下所使用的符号我们把输入特征称为x 而x同时也是第零层的激活函数所以a[0] = x 最后一层的激活函数 a[L] = y帽所以a[L]等于神经网络的预测输出也就是等于预测值y帽现在我们已经知道了神经网络看起来是什么样的以及在构建深度神经网络时会使用的各种符号我知道在本节课中我们已经介绍了很多这样的符号如果你不经意间忘记了某个符号的含义不用担心我们在课程网站上公布了符号列表你可以在那儿找到这些符号的定义后面我会跟大家讲讲在这种类型的网络中前向传播究竟是什么样的我们下节课见翻译 | 审阅：Cousera Global Translator Community

PreviousRandom Initialization NextForward Propagation in a Deep Network

Last updated 6 years ago

Was this helpful?