机器学习十大算法之一：SVM支持向量机

时间 2021-01-13

机器学习十大算法之一：SVM支持向量机

1 SVM思维导图

2 SVM

2.1 SVM概念

SVM：寻找到一个超平面使样本分成两类，并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数(每个特征的权重)。

2.2 确信度

与超平面的距离表示分类的确信度，距离越远则分类正确的确信度越高：

确信度的推导 - 超平面间的距离

超平面1： $w x_{1} + b_{1} = 0$
超平面2： $w x_{2} + b_{2} = 0$
向量的运算： $x_{2} = x_{1} + t w$
$w x_{2} + b_{2} = w (x_{1} + t w) + b_{2} = w x_{1} + t | | w | |^{2} + b_{2} = - b_{1} + t | | w | |^{2} + b_{2} = 0$
可以求出t： $t = (b_{1} - b_{2}) / | | w | |^{2}$
计算距离： $D = | | t w | | = | t | | | w | | = (b_{1} - b_{2}) / | | w | |^{2} * | | w | | = \frac{(b_{1} - b_{2})}{| | w | |}$
超平面线性方程： $w^{T} x + b = 0$
样本中任意点到超平面距离：
$r = \frac{w^{T} x + b}{| | w | |}$
$x$ 是样本点，不在超平面上，所以 $w^{T} x + b$ 不等于0

2.3 超平面

2.3.1 样本分类

对每个向量有：

$w^{T} \cdot x_{i} + b >= 1, x_{i}$ 属于类1

$w^{T} \cdot x_{i} + b <= - 1, x_{i}$ 属于类2

所以 $y_{i} (w^{T} \cdot x_{i} + b) >= 1$

2.3.1 样本的正确分类 - 拉格朗日方法

前面计算的确信度，超平面之间的距离，有如下近似：
最大化 $\frac{2}{| | w | |}$ ，等价于最小化 $\frac{1}{2} | | w | |^{2}$

a. 样本的正确分类：

$m i n_{w, b} \frac{1}{2} | | w | |^{2}$
$s . t . y_{i} (w^{T} x_{i} + b) >= 1, i = 1, 2, 3, . . ., m$

b. 样本正确分类(拉格朗日方法)：

$f (x) = w^{T} x + b$
$L (w, b, α) = \frac{1}{2} | | w | |^{2} + \sum_{i = 1}^{m} α_{i} (1 - y_{i} (w^{T} x_{i} + b))$

c. 对偶问题：原问题极小极大到对偶而难题的极大极小

m i n_{w, b} m a x_{α}^{L (w, b, α)} - > m a x_{α} m i n_{w, b}^{L (w, b, α)}