机器学习十大算法之一:SVM支持向量机
1 SVM思维导图
2 SVM
2.1 SVM概念
SVM:寻找到一个超平面使样本分成两类,并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数(每个特征的权重)。
2.2 确信度
与超平面的距离表示分类的确信度,距离越远则分类正确的确信度越高:
确信度的推导 - 超平面间的距离
2.3 超平面
2.3.1 样本分类
对每个向量有:
-
wT⋅xi+b>=1,xi
属于类1
-
wT⋅xi+b<=−1,xi
属于类2
- 所以
yi(wT⋅xi+b)>=1
2.3.1 样本的正确分类 - 拉格朗日方法
前面计算的确信度,超平面之间的距离,有如下近似:
最大化
2||w||
,等价于最小化
12||w||2
a. 样本的正确分类:
minw,b12||w||2
s.t.yi(wTxi+b)>=1,i=1,2,3,...,m
b. 样本正确分类(拉格朗日方法):
f(x)=wTx+b
L(w,b,α)=12||w||2+∑mi=1αi(1−yi(wTxi+b))
c. 对偶问题:原问题极小极大到对偶而难题的极大极小
minw,bmaxL(w,b,α)α−>maxαminL(w,b,α)w,b