TF之AutoML框架:AutoML框架的简介、特点、使用方法详细攻略


奇迹帅气
奇迹帅气 2022-09-19 16:11:05 51128
分类专栏: 资讯

TF之AutoML框架:AutoML框架的简介、特点、使用方法详细攻略

目录

AutoML框架的简介

AutoML框架的特点

AutoML框架的使用方法

AutoML VS AutoKeras 框架


AutoML框架的简介

AutoML官网:https://www.automl.org/

      自动化机器学习,简单来说就是一种自动化任务的方法:预处理并清理数据、选择并构建适当的功能、选择合适的模型系列、优化模型超参数、后处理机器学习模型、批判性地分析所获得的结果。

         在机器学习自动化方面,谷歌的 AutoML 无疑地位稳固。AutoML 基于谷歌最新的图像识别技术神经架构搜索( Neural Architecture Search ,NAS)。NAS 是一种算法,会根据特定数据集搜索最佳神经网络架构,以在该数据集上执行特定任务。AutoML 是一套机器学习工具,可以轻松训练高性能深度网络,而无需用户掌握深度学习或 AI 知识,所有你需要的只是标记数据!

     AutoML是为非ML专家提供机器学习的方法和过程,以提高ML的效率,加速机器学习的研究。ML近年来取得了相当大的成就,越来越多的学科依赖于它。然而,这一成功至关重要地依赖于人类学习专家执行手动任务。由于这些任务的复杂性常常超出非ML专家,ML的应用的快速增长产生了对现成的机器学习方法的需求,这些方法可以容易地使用且无需专家知识。我们称之为以机器学习自动化的渐进自动化为目标的研究领域。

     AutoML可以帮助选择模型并选择超参数。这个术语多被用来描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法,例如随机森林,梯度增强机器,神经网络等,AutoML库、研讨会、研究和竞赛都可以被囊括进这一领域。

理解:一般情况下,进行机器学习首先需要大量的训练数据,再由机器学习工程师/数据科学家对数据进行分析,设计算法形成训练模型;这需要大量的专业知识。但是,如果使用AutoML,就像是在使用一个工具,我们只需要将训练数据集传入AutoML,那么这个工具就会自动帮我们生成参数和模型,形成训练模型,这样即使不具备机器学习方面深入的专业知识也可以进行机器学习方面的工作。

1、AutoML库:包括auto-sklearn(将AutoWEKA扩展为python)、H2O AutoML和TPOT。 AutoML.org(以前称为ML4AAD,用于自动算法设计的机器学习)自2014年以来,一直被用在ICML等机器学习学术会议上。
(1)、在谷歌发布AutoML之前,业内已经存在不少AutoML库。其中最早的是2013年发布的AutoWEKA,其可以自动选择模型并选择超参数。
2、Cost:AutoML价格也并不算亲民,每小时收费20美元。
(1)、此外,一旦你开始训练,则无法导出模型,并且得用谷歌提供的API在云上运行你的网络,这些限制看起来都不是很方便

AutoML框架的特点

1、机器学习(Machine Learning, ML)近年来取得了相当大的成功,越来越多的学科需要依赖它。然而,这个成功的关键是需要人类机器学习工程师完成以下的工作:

  • 预处理数据
  • 选择适当的功能
  • 选择一个适当的模型选择系列
  • 优化模型超参数
  • 后处理机器学习模型
  • 严格分析所得的结果

2、AutoML借鉴了机器学习的许多学科,主要是:

  • 贝叶斯优化
  • 结构化数据和大数据的回归模型
  • Meta 学习
  • 转移学习
  • 组合优化

AutoML框架的使用方法

1、AutoML的主要问题可以由三部分构成:特征工程、模型选择、算法选择。

(1)、特征工程

特征工程在机器学习中有着举足轻重的作用。在AutoML中,自动特征工程的目的是自动地发掘并构造相关的特征,使得模型可以有最优的表现。除此之外,还包含一些特定的特征增强方法,例如特征选择、特征降维、特征生成、以及特征编码等。这些步骤目前来说都没有达到自动化的阶段。

上述这些步骤也伴随着一定的参数搜索空间。第一种搜索空间是方法自带的,例如PCA自带降维参数需要调整。第二种是特征生成时会将搜索空间扩大。

(2)、模型选择

模型选择包括两个步骤:选择一个模型,设定它的参数。相应地,AutoML的目的就是自动选择出一个最合适的模型,并且能够设定好它的最优参数。

(3)、算法选择

对于算法选择,AutoML的目的是自动地选择出一个优化算法,以便能够达到效率和精度的平衡。常用的优化方法有SGD、L-BFGS、GD等。使用哪个优化算法、对应优化算法的配置,也需要一组搜索空间。

AutoML VS AutoKeras 框架

 AutoMLAutoKeras
家长谷歌的TensorFlowKeras
花费20 dollar/hfree
开源NoYes
基于云yes(训练和评价)No
支持的模型用于分类的卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)用于分类的卷积神经网路(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)
核心技术带梯度策略更新的强化学习高效神经架构搜索(参见《Efficient NeuralArchitecture Search via Parameter Sharing》

参考文章
分享一篇比较全面的AutoML综述
 

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=3507
赞同 0
评论 0 条
奇迹帅气L0
粉丝 0 发表 7 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2941
【软件正版化】软件正版化工作要点  2860
统信UOS试玩黑神话:悟空  2819
信刻光盘安全隔离与信息交换系统  2712
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1246
grub引导程序无法找到指定设备和分区  1213
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  163
点击报名 | 京东2025校招进校行程预告  162
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  160
华为纯血鸿蒙正式版9月底见!但Mate 70的内情还得接着挖...  157
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!