视频字幕
感知机是1957年由Rosenblatt提出的最简单的神经网络模型,专门用于解决二分类问题。它的基本思想是接收多个输入信号,通过权重加权求和,再使用激活函数输出分类结果。右图展示了感知机的分类效果:蓝色点代表一类样本,红色点代表另一类样本,绿色直线就是感知机学习到的决策边界,能够将两类样本正确分开。
感知机的数学模型可以表示为f(x)等于sign函数作用于权重向量w与输入向量x的内积加上偏置b。其中w是权重向量,决定了决策边界的方向;x是输入向量,代表样本特征;b是偏置项,决定决策边界的位置。sign函数是激活函数,将连续值映射为正1或负1的离散输出。右图展示了不同参数对决策边界的影响。
感知机学习算法是一个迭代过程。首先初始化权重和偏置为零,然后对每个训练样本计算预测输出。如果预测错误,就根据更新规则调整参数:权重增加学习率乘以真实标签乘以输入特征,偏置增加学习率乘以真实标签。右图展示了算法的迭代过程,可以看到决策边界逐步调整,直到正确分类所有训练样本。
现在我们用Python实现感知机算法。首先定义Perceptron类,包含学习率、权重和偏置属性。fit方法实现训练过程:初始化参数为零,然后在每个epoch中遍历所有样本,如果预测错误就更新参数。predict方法用于预测新样本。右图展示了代码的执行流程:初始化参数、训练循环更新权重、最后进行预测输出。
现在我们通过一个完整的案例来演示感知机的使用。首先生成训练数据,包含4个二维样本点,其中蓝色点标签为负1,红色点标签为正1。然后创建感知机实例并进行训练。右图实时展示了训练过程:随着训练轮数增加,决策边界逐步调整,准确率不断提升,最终达到100%正确分类。这个例子展示了感知机在线性可分数据上的有效性。