Binary Classification

欢迎回来本周我们将会重温神经网络编程的基础知识我们发现当你实现一个神经网络的时候一些技巧是非常重要的比如如果你有一个含有m个训练样本的训练集你可能习惯于用一个for循环来处理这m个训练样本但当你实现一个神经网络的时候你一般想训练整个训练集但不显式使用for循环来遍历整个训练集那么，你将在本周的资料中看到如何实现这一点另外，当你在你的网络中组织计算的时候经常使用所谓的前向传播以及所谓的反向传播所以在本周的资料中你还将了解到为什么在训练神经网络时计算可以被正向转播组织为一次前向传播过程以及一次反向传播过程

在本周的材料中我想使用逻辑回归算法作为例子以使其更容易理解即使你之前已经了解过逻辑回归算法我想在这周的材料中你仍然会收获一些新的有趣的想法所以让我们开始吧逻辑回归是一个二元分类算法所以让我们从这样一个问题开始这里有一个二元分类问题的例子你也许有一张输入图片像这样你希望算法输出一个0或1标签指明图上是不是猫输出1说明是猫，输出0说明不是猫在这里，我们用符号y来表示输出标签让我们先来看一看图像在计算机里是怎么表示的为了在计算机里保存一幅（彩色）图像计算机要存储3个独立的矩阵分别对应着图像的红、绿、蓝3个颜色通道

所以，如果你的图像大小是64x64 那么你会有3个64x64大小的实数矩阵分别代表图像的红、绿、蓝3个颜色通道尽管我在幻灯片上画的矩阵比实际小的多大小只是5x4，而不是64x64 所以，为了用向量表示这些像素矩阵我们将把这些矩阵中的像素值展开为一个向量x 作为算法的输入为了将这些像素值展开成一个向量我们所做的就是按下面方法定义一个与该图像相对应的向量我们直接将255、231.....等这些像素值取出放入向量x中直到红色通道的像素值全部取出放入到向量x中接着是255、134、255...等代表绿色通道的像素值最后是红色蓝色通道的像素值最终，我们会得到一个非常长的向量向量中列出了图像中红、绿、蓝三个通道的像素值如果图像的大小是64x64 那么该向量的维度将会是64x64x3 因为这就是图像的矩阵包含的元素总数在这个例子中，向量的总长度为12288 也就是64x64x3的乘积并且，我们将用n(x) = 12288 来表示输入特征向量x的维度并且，有时候为了简化，我也会直接用小写n 来表示输入特征向量的维度

所以，在二元分类问题中我们的目标是学习到这样的一个分类器：我们输入一幅以特征向量x表示的图像然后预测对应的输出y是1还是0 即，这幅图上是猫还是不是猫先让我们来罗列出一些符号这些符号将会在余下课程中陆续用到单个样本由一对（x,y）表示其中，x是一个n(x)维的特征向量 y是标签，取值为0或1 训练集包含m个训练样本所以训练集将被写成(x(1),y(1)) 表示第一个样本的输入和输出 (x(2),y(2))代表第二个样本的输入和输出直到(x(m),y(m))，表示最后一个样本输入和输出因此，我将使用小写m代表训练集的样本总数并且，有时为了强调是表示训练集的样本总数我会写成M=M(train) 当是测试集时我有时会用m(test)来表示测试集的样本总数因此，m(test)等于测试集的样本总数最后，为了将所有的训练样本写成更加紧凑的形式我们将定义一个矩阵，用大写X表示 X定义如下：将训练集中的输入x(1)、x(2)....x(m)取出按列排列到矩阵X中因此，我们将x(1)放在矩阵的第一列中 x(2)放在矩阵的第二列中，直到x(m) 这样，便得到了矩阵X 因此，矩阵M将有m列，m即训练样本的总数同时矩阵X有n(x)行请注意，在一些其他课程中，你可能会看到矩阵X的定义是将训练样本的输入按行排列的像这样 x1的转置到x(m)的转置事实证明，在神经网络中使用左边的表示方法，运用时会相对简单概括一下，X是一个n(x)乘m维的矩阵在Python中你会看到X.shape命令这是Python里得到矩阵形状的命令的输出是n(x)，m 这表示X是一个n(x)乘m维的矩阵以上就是你如何组织训练样本的输入x到矩阵X 那么如何组织输出标签Y呢事实证明要使你应用神经网络时更简单你同样应该讲y按列排列因此，Y等于[ y(1) y(2) ... y(m) ] 直到y(m) Y是一个1xm大小的矩阵同样的，使用Python命令Y.shape，将会输出(1，m) 表示Y是一个1xm大小的矩阵在本课程之后，当你实现你自己的神经网络时你会发现一个非常有用的惯例：混合不同的训练样本数据在这里数据是指单个x或y，或者之后其他的数目数据混合不同训练样本的数据并将它们按列排列像我们之前对x和y做的那样

以上就是我们之后会在回归算法和神经网络算中使用到的一些符号如果你忘记了某个符号的意义比如M代表什么 N代表什么或者其他什么的我们已经在课程网站贴出了符号指南你可以用它快速的查找特定符号的意义就这样，让我们开始进入下一节课着手实现逻辑回归算法 GTC字幕组翻译

PreviousAbout this Course NextLogistic Regression

Last updated 6 years ago

Was this helpful?