A note on python/numpy vectors

Python提供了广播操作的能力更广泛地说 Python和NumPy带来了极佳的灵活性我认为这既是Python作为一门编程语言的优势也是它的劣势其优势在于增加了语言的表达性凭借其强大的灵活性你只用仅仅一行代码就能完成大量的工作但这也带来一些缺点因为广播操作和其强大的灵活性有时会引入十分微妙或者非常奇怪的bug 如果你并不熟悉诸如广播等特性的各种复杂的工作机制的话例如如果你将一个列向量与行向量相加你可能会期望它抛出维度不匹配或者类型错误之类的报错但实际上你会得到一个行向量和列向量求和后的矩阵 Python的这些奇怪表现有其内在的逻辑但如果你对Python不熟悉就会像我见过的一些学生写出非常奇怪非常难以发现的bug 所以我想在这个视频里和你们分享一些技巧它们在排除各种奇怪的bug 和简化代码方面对我帮助很大我也希望在这些技巧的帮助下你们也能更容易的写出没有bug的Python和NumPy代码

为了说明Python和NumPy中尤其是在构建向量时的一些不太直观的效果让我来做个快速演示令a=np.random.randn(5) 这会产生5个高斯随机变量并储存在数组a中输入print(a) 结果表明 a的形状是这种(5,)的结构这在Python中叫做秩为1的数组它既不是行向量也不是列向量这会略微导致一些不直观的影响比如我打印a的转置它的结果看上去和a一样所以 a和a的转置看起来一样又如打印a和a转置的内积你也许认为a乘以a转置或者说a的外积是一个矩阵但如果我这样写得到的却是一个数字所以我建议你在编写神经网络时不要使用这种数据结构即形如(5,)或者(n,)这样的秩为1的数组而是令a的形状为(5,1) 这会使a成为一个5乘1的列向量在之前 a和a转置看起来是一样的而现在a的转置是一个行向量要注意这个细微的差别使用这种数据结构时打印a转置的结果中有两个方括号而之前却只有一个方括号区别在于这是一个真正的1乘5的矩阵而之前的是秩为1的数组并且如果你打印a和a转置的积这样会得到向量的外积对吧? 向量的外积是一个矩阵下面我们更深入地了解一下刚才看到的情况刚才我们运行的第一个命令是这个它创建了这样一个数据结构 a.shape的值就是这个奇怪的(5,) 这称为秩为1的数组这是个很奇怪的数据结构它的行为并不总与行向量或者列向量相一致这使得它会带来一些不直观的影响所以我的建议是当你在做编程练习时或者准确地说在实现作业中的逻辑回归或神经网络时不要使用这种秩1为数组

相反如果你在每次创建数组时都确保使它是一个列向量就像这样创建5乘1的向量或者确保它是一个行向量那么这些向量的行为将更容易理解所以这里a.shape等于(5,1) 这实际上就是一个列向量因此你可以把它当成5乘1的矩阵也就是列向量然后这里a.shape的值是(1,5) 它的行为始终和行向量一致

所以当你需要一个向量时可以二者择其一但不要用秩为1的数组我在编程时还经常会做这样一件事如果我不太确定某一个向量的维度我通常会将其放入断言语句中就像在这里用来确保a是5乘1的向量所以它是个列向量执行这些断言的成本很低并且还能充当代码的文档当你觉得需要的时候就使用断言语句不要犹豫最后如果出于某些原因你得到了一个秩1为数组你可以用reshape来改变它的形状 a=a.reshape((5,1)) 比如使其成为(5,1)或者(1,5)的数组这样它就会始终表现为列向量或者行向量我有时会见到学生因为这些秩为1的数组的不直观的行为出现一些很难找出的bug 通过在旧代码中消除秩为1的矩阵我觉得我的代码变得更简单了而且我并不觉得这样写会限制代码的表达我从来不用秩为1的数组要点是为了简化代码不要使用秩为1的数组始终使用n乘1的矩阵本质上是列向量或者使用1乘n的矩阵本质上是行向量自由使用断言语句来复查矩阵和数组的维度还有不要怕使用reshape操作来确保矩阵和向量是你所需要的维度由此我希望这些建议能帮你从源头消除Python代码的bug 也能让编程练习变得更容易

PreviousBroadcasting in Python NextExplanation of logistic regression cost function (optional)

Last updated 6 years ago