机器学习(公式推导与代码实现)--sklearn机器学习库

风晓 2024-01-02 08:01:43  50700 赞同 0 反对 0

分类：资源

sklearn全称是scikit-learn，它是一个基于Python的机器学习类库，主要建立在NumPy、Pandas、SciPy和Matplotlib等类库之上，基本上覆盖了常见了分类、回归、聚类、降维、模型选择和预处理模块。

2.sklearn源码

下图是sklearn在GitHub上的源代码，编程语言主要包括：91.4%的Python，6.5%的Cython，1.3%的C++和0.8%的Other。如下所示：

二.模型选择和预处理

1.模型选择
解析：网格搜索，交叉验证
2.预处理
解析：评估指标，数据预处理

三.有监督学习模型

可以将有监督模型分为生成式模型和判别式模型，常见的生成式模型包括朴素贝叶斯、HMM和隐含狄利克雷分配(LDA)，其它的基本都是判别式模型。
1.线性模型
解析：线性回归，对数几率回归，LASSO回归，Ridge回归，线性判别分析(LDA)
2. $k$ 近邻
3.决策树
解析：ID3，C4.5，CART
4.神经网络
解析：感知机，神经网络
5.支持向量机
解析：线性可分，近似线性可分，线性不可分
6.集成模型
(1)Boosting
解析：AdaBoost，GBDT，XGBoost，LightGBM，CatBoost
(2)Bagging
解析：随机森林

四.无监督学习模型

1.聚类
解析： $k$ 均值聚类，层次聚类，谱聚类
2.降维
解析：主成分分析(PCA)，奇异值分解(SVD)

五.概率模型

1.最大信息熵模型
2.贝叶斯概率模型
解析：朴素贝叶斯，贝叶斯网络
3.期望最大化(EM)算法
4.概率图模型
解析：隐马尔科夫模型(HMM)，条件随机场(CRF)
5.马尔可夫链蒙特卡洛(MCMC)

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等，可点击“私信”按钮向作者进行反馈；如作者无回复可进行平台仲裁，我们会在第一时间进行处理！

评价 0 条

相关资源

写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（二） 2023-12-31 51431 浏览
接上一篇写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（一）
写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（二） 2023-12-31 49064 浏览
接上一篇写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（一）
写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（二） 2023-12-31 53478 浏览
接上一篇写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（一）
人工智能基础：机器学习常见的算法介绍 2023-12-23 49776 浏览
今天给大家聊聊机器学习算法相关的知识，一起来看看吧！机器学习的算法主要包括监督学习、无监督学习、半监督学习、迁移学习、强化学习。
写给程序员的机器学习入门 (一) - 从基础说起（二） 2023-12-31 51331 浏览
接上一篇写给程序员的机器学习入门 (一) - 从基础说起（一）
写给程序员的机器学习入门 (一) - 从基础说起（一） 2023-12-31 50681 浏览
目前的机器学习入门大多要不门槛比较高，要不过于着重使用而忽视基础原理，所以我决定开一个新的系列针对程序员讲讲机器学习。这个系列会从机器学习的基础原理开始一直讲到如何应用，看懂这个系列需要一定的编程知识（主要会使用 python 语言），但不需要过多的数学知识，并且对于涉及到的数学知识会作出简单的介绍。
写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（一） 2023-12-31 50442 浏览
pytorch 是目前世界上最流行的两个机器学习框架的其中之一，与 tensoflow 并峙双雄。它提供了很多方便的功能，例如根据损失自动微分计算应该怎样调整参数，提供了一系列的数学函数封装，还提供了一系列现成的模型，以及把模型组合起来进行训练的框架。pytorch 的前身是 torch，基于 lua，而 pytorch 基于 python，虽然它基于 python 但底层完全由 c++ 编写，支持自动并列化计算和使用 GPU 加速运算，所以它的性能非常好。
人工智能基础：机器学习常见的算法介绍 2023-12-25 47896 浏览
今天给大家聊聊机器学习算法相关的知识，一起来看看吧！机器学习的算法主要包括监督学习、无监督学习、半监督学习、迁移学习、强化学习。
写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（一） 2023-12-31 50785 浏览
生物神经元与人工神经元在了解神经元网络之前，我们先简单的看看生物学上的神经元是什么样子的，下图摘自维基百科：
写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（一） 2023-12-31 51507 浏览
这篇将会着重介绍使用 pytorch 进行机器学习训练过程中的一些常见技巧，掌握它们可以让你事半功倍。使用的代码大部分会基于上一篇最后一个例子，即根据码农条件预测工资🙀。