Dataset:adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介、下载、使用方法之详细攻略


超帅与方盒
超帅与方盒 2022-09-19 11:45:02 53140
分类专栏: 资讯

Dataset:adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介、下载、使用方法之详细攻略

目录

adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介

0、部分数据集

1、数据集描述

2、在从训练/测试集中删除未知数后,错误准确度报告如下)

adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的下载

adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的使用方法

1、经典案例


adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介

       adult数据,Barry Becker 从 1994 年人口普查数据库中提取,常用于分类预测(确定一个人的年收入是否超过 50K)、数据挖掘与可视化任务。具体数据集可以在官网链接上找到,由Ronny Kohavi and Barry Becker捐赠。该数据集包含48842个实例,包括continuous、discrete ,如果去掉unknown values,共计45222实例。其中有6个样本是重复或冲突的实例,

官网http://www.census.gov/ftp/pub/DES/www/welcome.html
下载地址Index of /ml/machine-learning-databases/adult

0、部分数据集

ageworkclassfnlwgteducationeducation_nummarital_statusoccupationrelationshipracesexcapital_gaincapital_losshours_per_weeknative_countrysalary
39State-gov77516Bachelors13Never-marriedAdm-clericalNot-in-familyWhiteMale2174040United-States<=50K
50Self-emp-not-inc83311Bachelors13Married-civ-spouseExec-managerialHusbandWhiteMale0013United-States<=50K
38Private215646HS-grad9DivorcedHandlers-cleanersNot-in-familyWhiteMale0040United-States<=50K
53Private23472111th7Married-civ-spouseHandlers-cleanersHusbandBlackMale0040United-States<=50K
28Private338409Bachelors13Married-civ-spouseProf-specialtyWifeBlackFemale0040Cuba<=50K

1、数据集描述

name中文type
age年龄continuous
workclass工人阶级Private、Self-emp-not-inc、Self-emp-inc、Federal-gov、Local-gov、State-gov、Without-pay、Never-worked
fnlwgtfnlwgtcontinuous
education教育Bachelors、Some-college、11th、HS-grad、Prof-school、Assoc-acdm、Assoc-voc、9th、7th-8th、12th、Masters、1st-4th、10th、Doctorate、5th-6th、Preschool
education-num最高教育水平continuous
marital-status婚姻状况Married-civ-spouse、Divorced、Never-married、Separated、Widowed、Married-spouse-absent、Married-AF-spouse
occupation职业Tech-support、Craft-repair、Other-service、Sales、Exec-managerial、Prof-specialty、Handlers-cleaners、Machine-op-inspct、Adm-clerical、Farming-fishing、Transport-moving、Priv-house-serv、Protective-serv、Armed-Forces
relationship关系Wife、Own-child、Husband、Not-in-family、Other-relative、Unmarried
race种族White、Asian-Pac-Islander、Amer-Indian-Eskimo、Other、Black
sex性别Female、Male
capital-gain资本收益continuous
capital-loss资本损失continuous
hours-per-week每周几小时continuous
native-country国家或地区United-States、Cambodia、England、Puerto-Rico、Canada、Germany、Outlying-US(Guam-USVI-etc)、India、Japan、Greece、South、China、Cuba、Iran、Honduras、Philippines、Italy、Poland、Jamaica、Vietnam、Mexico、Portugal、Ireland、France、Dominican-Republic、Laos、Ecuador、Taiwan、Haiti、Columbia、Hungary、Guatemala、Nicaragua、Scotland、Thailand、Yugoslavia、El-Salvador、Trinadad&Tobago、Peru、Hong、Holand-Netherlands
salary年薪Probability for the label '>50K'  : 23.93% / 24.78% (without unknowns)
Probability for the label '<=50K' : 76.07% / 75.22% (without unknowns)

2、在从训练/测试集中删除未知数后,错误准确度报告如下)

C4.5:84.46+-0.30
Naive-Bayes:83.88+-0.30
NBTree:85.90+-0.28

以下算法随后以以下错误率运行,所有这些都是在移除未知数并使用原始训练/测试拆分之后。所有这些数字都是使用具有默认值的 MLC++ 直接运行的。

   Algorithm               Error
-- ----------------        -----
1  C4.5                    15.54
2  C4.5-auto               14.46
3  C4.5 rules              14.94
4  Voted ID3 (0.6)         15.64
5  Voted ID3 (0.8)         16.47
6  T2                      16.84
7  1R                      19.54
8  NBTree                  14.10
9  CN2                     16.00
10 HOODG                   14.82
11 FSS Naive Bayes         14.05
12 IDTM (Decision table)   14.46
13 Naive-Bayes             16.12
14 Nearest-neighbor (1)    21.42
15 Nearest-neighbor (3)    20.35
16 OC1                     15.04
17 Pebls                   Crashed.  Unknown why (bounds WERE increased)

adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的下载

下载地址Index of /ml/machine-learning-databases/adult

adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的使用方法

1、经典案例

 
相关文章
Dataset:adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介、下载、使用方法之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用Shap值对XGBoost模型实现可解释性案例之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用Shap值对XGBoost模型实现可解释性案例之详细攻略实现

相关文章
Dataset:adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介、下载、使用方法之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用shap决策图结合LightGBM模型实现异常值检测案例之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用shap决策图结合LightGBM模型实现异常值检测案例之详细攻略实现

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=2145
赞同 0
评论 0 条
超帅与方盒L0
粉丝 0 发表 7 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2935
【软件正版化】软件正版化工作要点  2854
统信UOS试玩黑神话:悟空  2811
信刻光盘安全隔离与信息交换系统  2702
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1235
grub引导程序无法找到指定设备和分区  1205
点击报名 | 京东2025校招进校行程预告  162
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  160
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  156
华为纯血鸿蒙正式版9月底见!但Mate 70的内情还得接着挖...  154
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!