ML之SVM:SVM算法的简介、应用、经典案例之详细攻略


你叫啥
你叫啥 2022-09-20 11:22:05 51270
分类专栏: 资讯

ML之SVM:SVM算法的简介、应用、经典案例之详细攻略

目录

SVM算法的简介

1、SVM模型分类—线性可分、线性、非线性

2、SVM的决策边界

3、SVM中的核函数

4、SVM算法推导

1.1、SVM转为对偶问题的求解—SMO算法思

5、SVM中“损失+惩罚”框架的灵活性

6、SVM的损失函数分析

SVM的应用——解决的问题类型

1、SVM用作分类

1.1、SVM与二分类

1.2、SVM与多分类

2、SVM用作回归

SVM的经典案例


SVM算法的简介

        支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)。
        SVM的基本思想是:找到集合边缘上的若干数据(称为支持向量(Support Vector)),用这些点找出一个平面(称为决策面),使得支持向量到该平面的距离最大

1、SVM模型分类—线性可分、线性、非线性

        由简至繁的SVM模型包括:

  • 当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;
  • 当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机;
  • 当训练样本线性不可分时,通过核技巧和软间隔最大化,学习一个非线性支持向量机;
线性可分数据


线性不可分数据

非线性数据

 

2、SVM的决策边界

        在分类问题中,很多时候有多个解,如下图左边所示,在理想的线性可分的情况下其决策平面会有多个。而SVM的基本模型是,在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,SVM算法计算出来的分界会保留对类别最大的间距,即有足够的余量,如下图右边所示。

3、SVM中的核函数

        在解决线性不可分问题时,它可以通过引入核函数,巧妙地解决了在高维空间中的内积运算,从而很好地解决了非线性分类问题。如下图所示,通过核函数的引入,将线性不可分的数据映射到一个高纬的特征空间内,使得数据在特征空间内是可分的。如下图所示:

高斯核函数是无穷维的



 

4、SVM算法推导

1.1、SVM转为对偶问题的求解—SMO算法思

5、SVM中“损失+惩罚”框架的灵活性

6、SVM的损失函数分析

SVM的应用——解决的问题类型

1、SVM用作分类

1.1、SVM与二分类

二分类Binary Classification,解决输出是0还是1的问题。SVM解决的是二分类。

1.2、SVM与多分类

T1、线性核函数Linear Kernal:采用的策略是"one versus one" 。
T2、线性支持向量分类器LinearSVC,采用的策略是"one versus all"

2、SVM用作回归

       支持向量回归(Support Vector Regression, SVR)将SVM由分类问题推广至回归问题可以得到支持向量回归(Support Vector Regression, SVR),此时SVM的标准算法也被称为支持向量分类(Support Vector Classification, SVC)。

       支持向量分类的方法能被推广到解决回归问题,称为支持向量回归。由支持向量分类产生的模型仅依赖训练数据的子集,因为创建模型的代价函数并不考虑超过边界的训练点。类似地,由支持向量回归产生的模型仅依赖训练数据的子集,因为创建模型的代价函数忽略任何接近模型预测的训练数据。
      支持向量回归有三个不同的执行版本:rbfSVR,polySVR,linearSVR。linearSVR执行速度比SVR要快,但只提供线性核。fit方法取X, y作为输入参数,这里,y取浮点值而不是分类的整数值。

  1. from sklearn import svm
  2. X = [[0, 0], [2, 2]]
  3. y = [0.5, 2.5]
  4. clf = svm.SVR()
  5. clf.fit(X, y)


 

SVM的经典案例

DL之NN/Average_Darkness/SVM:手写数字图片识别(本地数据集50000训练集+数据集加4倍)比较3种算法Average_Darkness、SVM、NN各自的准确率
MAT之SVM:SVM之Classification根据已有大量数据集案例,输入已有病例的特征向量实现乳腺癌诊断高准确率预测
MAT之SVM/BP:SVR(better)和BP两种方法比较且实现建筑物钢筋混凝土抗压强度预测
ML之SVM:随机产生100个点,建立SVM模型,找出超平面方程
ML之SVM:基于sklearn的svm算法实现对支持向量的数据进行标注

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=4279
赞同 0
评论 0 条
你叫啥L0
粉丝 0 发表 10 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2966
【软件正版化】软件正版化工作要点  2885
统信UOS试玩黑神话:悟空  2855
信刻光盘安全隔离与信息交换系统  2743
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1277
grub引导程序无法找到指定设备和分区  1244
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  169
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  168
点击报名 | 京东2025校招进校行程预告  164
华为纯血鸿蒙正式版9月底见!但Mate 70的内情还得接着挖...  161
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!