程序员笔记（九十五）神经网络的优化求解算法

外向笑小鸭子 2024-01-12 14:31:48  48631 赞同 0 反对 0

分类：资源标签：运维

程序员笔记（九十五）神经网络的优化求解算法

在神经网络中有几种常用的优化求解算法，在这里主要记录一下各个算法的优势和缺点，对选择提供一些依据。

常用算法

sgd：随机梯度下降法。每次从训练集中随机选择batch_size个样本进行正向传播计算平均loss，再进行反向传播更新权重参数。

Momentum SGD和Nesterov Momentum（下面统称动量法）：增加了动量项。

Adagrad：在学习率上做文章。固定的学习率除以每个参数的历史更新累加值。

Adadelta：直接对每次更新的△W进行改进，学习率由一个除法得到，分母是历史的梯度累加，分子是历史的参数更新累加值。

RMSprop：Hinton提出的。固定的学习率除以参数的历史更新累加值。看起来与Adagrad很像，但是RMSprop是按权重累加，解决了Adagrad越加越大的问题。

Adam：同时使用了动量和梯度的平方和加权。

算法优缺点

算法名称优点缺点

sgd 每次都能直奔目标点，不走弯路收敛速度慢，容易陷入局部最优点

动量法收敛速度比较快，具备跳出局部最优点的能力由于动量比较大，因此经常容易冲过目标点，然后再往回进行收敛

Adagrad 对不同参数的学习率区别对待，前期收敛速度比较快，不会陷入局部最优点训练后期学习率过小导致收敛速度变慢

Adadelta 不需要人工给定学习率，收敛速度快，不会陷入局部最优点容易冲过全局最优点

RMSprop Hinton已经给出学习率，收敛速度快，不会陷入局部最优点容易冲过全局最优点

实际使用中，可以选择目前最常用的几个，如RMSprop、Adam等，效果一般不错。不过据说Adam会比同样达到最优的sgd在性能上低1个百分点。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等，可点击“私信”按钮向作者进行反馈；如作者无回复可进行平台仲裁，我们会在第一时间进行处理！

评价 0 条

相关资源

写给程序员的机器学习入门 (一) - 从基础说起（一） 2023-12-31 50681 浏览
目前的机器学习入门大多要不门槛比较高，要不过于着重使用而忽视基础原理，所以我决定开一个新的系列针对程序员讲讲机器学习。这个系列会从机器学习的基础原理开始一直讲到如何应用，看懂这个系列需要一定的编程知识（主要会使用 python 语言），但不需要过多的数学知识，并且对于涉及到的数学知识会作出简单的介绍。
写给程序员的机器学习入门 (一) - 从基础说起（二） 2023-12-31 51330 浏览
接上一篇写给程序员的机器学习入门 (一) - 从基础说起（一）
为什么说程序员的世界离不开GitHub呢？ 2023-12-29 51032 浏览
为什么说程序员的世界离不开GitHub呢？我们可以从以下几个方面来理解GitHub的魔力：
盘点几个程序员实用的算法网站，你都用过吗？ 2023-12-21 51214 浏览
对于想成为一名程序员大佬的朋友来说，掌握算法是编写高性能代码的基础。由此可见算法对于一名优秀的程序员来说是非常重要的技术，今天给大家分享六个非常实用的算法学习网站，希望对大家学习算法知识能够提供一些参考！
程序员值得收藏提升自身能力的8个网站 2023-12-22 51877 浏览
今天给大家分享程序员值得收藏提升自身能力的8个网站
写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（一） 2023-12-31 50442 浏览
pytorch 是目前世界上最流行的两个机器学习框架的其中之一，与 tensoflow 并峙双雄。它提供了很多方便的功能，例如根据损失自动微分计算应该怎样调整参数，提供了一系列的数学函数封装，还提供了一系列现成的模型，以及把模型组合起来进行训练的框架。pytorch 的前身是 torch，基于 lua，而 pytorch 基于 python，虽然它基于 python 但底层完全由 c++ 编写，支持自动并列化计算和使用 GPU 加速运算，所以它的性能非常好。
你好程序员，你有以下误区么？ 2023-12-30 52358 浏览
关于技术，很多本科生都存在诸多误区。初学者总喜欢追随牛逼的技术，实在过于盲目，找准自己的定位最重要。
2023程序员必备的工具大全 2023-12-23 49506 浏览
程序员生产力工具大全
软件：Typora 非常全面使用教程，程序员写文档必备工具 2023-12-25 51506 浏览
对于程序员来说，可能最头疼的就是写文档了，随着MarkDown写作工具的出现，写文档变得就简单很多，尤其是喜欢写博客的程序员，有了MarkDown写文档工具，大大提升了文档或者博客的编写效率，今天就来带大家了解一下MarkDown相关的知识，以及给大家准备目前最好用MarkDwon工具——Typora。希望对大家编写文档、博客提供一些帮助！
程序员必知的 89 个操作系统核心概念 2023-12-25 50363 浏览
1. 操作系统（Operating System，OS）：是管理计算机硬件与软件资源的系统软件，同时也是计算机系统的内核与基石。操作系统需要处理管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

程序员笔记 （九十五）神经网络的优化求解算法

相关资源

关注我们

程序员笔记（九十五）神经网络的优化求解算法