视频字幕
你们知道吗?电脑也能"看"图片!手机人脸解锁、自动驾驶识别行人,这些都用到了卷积神经网络技术。而卷积运算,就是这个神奇技术的第一步,也是最重要的一步。它就像电脑的"眼睛",帮助电脑从图片中找出重要的特征和图案。
首先我们要理解,电脑眼中的图片是什么样的。对电脑来说,一张图片就是一个数字矩阵。每个小格子叫做像素,每个像素用一个数字表示亮度。数字0代表黑色,数字1代表白色。我们这里用一个简单的4乘以4的黑白图像作为例子。
现在我们来认识卷积核。卷积核是一个小的矩阵,通常是3×3大小,就像一个特殊的滤镜。这个卷积核能检测图像中的特定特征,比如垂直边缘。我们用颜色来区分:蓝色表示正数,红色表示负数,灰色表示0。这个卷积核左边是正数,右边是负数,专门用来找垂直边缘。
现在开始卷积运算演示!我们把3×3的卷积核放在4×4图像的左上角,计算对应位置相乘再求和。这就是卷积运算的基本原理:图像每个位置的值乘以卷积核对应位置的值,然后把所有结果加起来,得到特征图中的一个数值。
让我们详细计算第一个位置。卷积核覆盖图像左上角3×3区域,我们将对应位置相乘:1×1=1,0×0=0,1×(-1)=-1,依此类推。把所有乘积加起来:1+0-1+0+0+0+1+0-1=0。所以特征图第一个位置的值是0。然后卷积核向右移动一步,计算下一个位置,直到遍历完整个图像,最终得到完整的特征图。
现在开始卷积运算的第一步:放置卷积核。我们把3×3的卷积核放在4×4图像的左上角位置。红色边框显示的是被卷积核覆盖的图像区域,也就是左上角的3×3区域。卷积核用黄色边框标出,里面的颜色表示不同的数值:蓝色是正数,红色是负数,灰色是零。
现在我们逐个元素进行相乘计算。左边是图像被覆盖的3×3区域,中间是卷积核,右边是对应位置相乘的结果。第一行:1×1=1,0×0=0,1×(-1)=-1。第二行:0×2=0,1×0=0,0×(-2)=0。第三行:1×1=1,0×0=0,1×(-1)=-1。最后把所有结果加起来:1+0-1+0+0+0+1+0-1=0,这就是特征图第一个位置的值。
欢迎学习卷积神经网络!今天我们来了解卷积运算,这是CNN的第一个重要层级。想象一下,卷积运算就像一个特殊的滤镜在图像上滑动,帮助计算机从图像中提取重要特征,比如边缘、纹理等。通过这个过程,计算机能够更好地理解和识别图像内容。
我们从一个4×4的黑白图像开始,1代表白色像素,0代表黑色像素。这是一个简单的棋盘图案。右边是3×3的卷积核,也叫滤镜,这个特定的核心是用来检测垂直边缘的。蓝色数字是正值,红色数字是负值,白色是零。
让我们详细看看第一个位置的计算过程。我们将卷积核覆盖在图像的左上角3×3区域上,然后进行逐元素相乘。1乘以1等于1,0乘以0等于0,1乘以负1等于负1,依此类推。最后将所有结果相加:1加0减1加0加0加0加1加0减1,最终结果是0。这就是卷积运算的核心:对应位置相乘再求和。
现在演示卷积核在图像上的滑动过程。卷积核从左上角开始,红色框显示当前覆盖的区域。第一个位置计算结果是0,填入特征图左上角。然后卷积核向右移动一步到第二个位置,计算结果是2。接着向下移动到第三个位置,结果是-2。最后到右下角第四个位置,结果是0。这样我们就得到了完整的2×2特征图。
让我们看看得到的特征图的意义。这个2×2的特征图成功检测出了图像中的垂直边缘。正值2用蓝色显示,表示检测到从暗到亮的垂直边缘。负值-2用粉色显示,表示从亮到暗的垂直边缘。零值表示没有检测到边缘变化。通过这样的卷积运算,卷积神经网络能够从原始图像中提取出各种重要特征,比如边缘、纹理、形状等,为后续的图像识别和分类任务打下坚实基础。这就是CNN第一层卷积运算的神奇之处!
我们成功完成了卷积运算!这个2×2特征图清楚地显示了垂直边缘检测结果。蓝色区域的正值表示从暗到亮的边缘,粉色区域的负值表示从亮到暗的边缘,白色的零值表示没有检测到边缘。这就是CNN第一层卷积层的作用:从原始图像中提取特征。CNN还有池化层用于降维压缩,全连接层用于最终分类。通过卷积运算,计算机能够从简单的像素数字中提取出有意义的特征,这就是人工智能"看懂"图像的秘密!