关于机器学习课 SVM中的两个疑问

1  函数间隔和几何间隔
 
几何间隔是 某一个样本 到超平面的距离
函数间隔是 函数值的绝对值    y(i) (wx +b)  即  |wx +b|    这里的w是w的转置
 
在图形上很容易画出来 几何间隔,也很容易理解,类似于点到直线的距离,点到平面的距离,画出来也很容易。
 
|wx +b|  /  ||w||  当w,b同倍数增长,也很好理解这个几何间隔不会变。
 
但是函数间隔 怎么再图形上去理解这个呢,能直接画出来吗
 
2  假如我首先拿到一堆数据,我应该怎么判断这个数据是否线性可分呢

小象老师a

赞同来自: liuzhixin137 fish

同学您好,非常感谢您的提问~~第二个问题如何判断数据线性可分,有一种办法是看两个数据集的凸包是否相交,http://blog.csdn.net/u013300875/article/details/44081067  这个链接中介绍了这个办法,希望对您有帮助~~   第一个问题里的函数距离按照公式字面意思理解是一个内积,y(wx+b)。   这个内积是怎么来的呢?首先在空间中有一个未知的点x,然后在超平面上取一点x',这样连接点 x 和 x' 的向量为(x-x')。   超平面的法向量是w,所以 w(x-x') 就是法向量和斜着的向量 x-x' 的内积。   我们对这个表达式再进行一下化简:wx'+b=0 (x'在超平面上),wx'=-b。所以 w(x-x')= wx-wx'=wx+b。y在这里相当于取绝对值,所以 y(wx+b)=yw(x-x')=|w(x-x')|,   也就是说,函数距离是 w 和(x-x') 的内积的绝对值,它对应的几何含义正是下方图中红色边框矩形的面积。   这个矩形的边长分别为 (x-x') 在法向量 w 方向上的投影 和 w的长度。由于这个矩形的面积受到 w 长度的影响,当 w 倍数增长时,函数距离也会倍数增长。
1212函数距离.png
   

要回复问题请先登录注册