机器学习(公式推导与代码实现)--sklearn机器学习库


风晓
风晓 2024-01-02 08:01:43 50700 赞同 0 反对 0
分类: 资源
  sklearn全称是scikit-learn,它是一个基于Python的机器学习类库,主要建立在NumPy、Pandas、SciPy和Matplotlib等类库之上,基本上覆盖了常见了分类、回归、聚类、降维、模型选择和预处理模块。

2.sklearn源码

下图是sklearn在GitHub上的源代码,编程语言主要包括:91.4%的Python,6.5%的Cython,1.3%的C++和0.8%的Other。如下所示:

二.模型选择和预处理

1.模型选择
解析:网格搜索,交叉验证
2.预处理
解析:评估指标,数据预处理

三.有监督学习模型

  可以将有监督模型分为生成式模型和判别式模型,常见的生成式模型包括朴素贝叶斯、HMM和隐含狄利克雷分配(LDA),其它的基本都是判别式模型。
1.线性模型
解析:线性回归,对数几率回归,LASSO回归,Ridge回归,线性判别分析(LDA)
2.近邻
3.决策树
解析:ID3,C4.5,CART
4.神经网络
解析:感知机,神经网络
5.支持向量机
解析:线性可分,近似线性可分,线性不可分
6.集成模型
(1)Boosting
解析:AdaBoost,GBDT,XGBoost,LightGBM,CatBoost
(2)Bagging
解析:随机森林

四.无监督学习模型

1.聚类
解析:均值聚类,层次聚类,谱聚类
2.降维
解析:主成分分析(PCA),奇异值分解(SVD)

五.概率模型

1.最大信息熵模型
2.贝叶斯概率模型
解析:朴素贝叶斯,贝叶斯网络
3.期望最大化(EM)算法
4.概率图模型
解析:隐马尔科夫模型(HMM),条件随机场(CRF)
5.马尔可夫链蒙特卡洛(MCMC)

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!

评价 0 条
风晓L1
粉丝 1 资源 2038 + 关注 私信
最近热门资源
银河麒麟桌面操作系统备份用户数据  125
统信桌面专业版【全盘安装UOS系统】介绍  120
银河麒麟桌面操作系统安装佳能打印机驱动方法  111
银河麒麟桌面操作系统 V10-SP1用户密码修改  105
最近下载排行榜
银河麒麟桌面操作系统备份用户数据 0
统信桌面专业版【全盘安装UOS系统】介绍 0
银河麒麟桌面操作系统安装佳能打印机驱动方法 0
银河麒麟桌面操作系统 V10-SP1用户密码修改 0
作者收入月榜
1

prtyaa 收益393.62元

2

zlj141319 收益218元

3

1843880570 收益214.2元

4

IT-feng 收益209.03元

5

风晓 收益208.24元

6

777 收益172.71元

7

Fhawking 收益106.6元

8

信创来了 收益105.84元

9

克里斯蒂亚诺诺 收益91.08元

10

技术-小陈 收益79.5元

请使用微信扫码

加入交流群

请使用微信扫一扫!