人工智能实验感知机PLA
目录
一、 感知机PLA
1. 算法原理
感知机针对二分类问题进行学习。输入为样本的特征向量$\bold x\in R^n$,输出为类别$y\in{+1,-1}$。
感知机的预测结果为$f(x)=sign(w\cdot x+b)$,其中$sign$为符号函数,在自变量大于0时为1,自变量小于0时为-1。$w$为权值向量,和x的维度相同。b是偏置,为标量。线性方程$w\cdot x+b$对应着特征空间的一个分离超平面,将特征空间分成两个部分,位于两部分的点分别对应正样本和负样本。
感知机利用损失函数对模型参量w和b进行更新学习。将误分类点$(x_i,y_i)$到分离超平面的距离定义为:

假设误分类点的集合为M,且不考虑$-\frac{1}{||w||}$则损失函数为:

可以采用随机梯度下降的方式来优化损失函数。w和b的损失函数梯度分别为:










