ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)


iak
iak 2022-09-19 12:10:52 52912
分类专栏: 资讯

ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

目录

利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

1、数据集基本信息

2、模型结果输出


相关文章
ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)
ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)实现

利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

1、数据集基本信息

  1. (3000, 13) 13 3000
  2. total_price object
  3. unit_price object
  4. roomtype object
  5. height object
  6. direction object
  7. decorate object
  8. area object
  9. age float64
  10. garden object
  11. district object
  12. total_price_Num float64
  13. unit_price_Num int64
  14. area_Num float64
  15. dtype: object
  16. Index(['total_price', 'unit_price', 'roomtype', 'height', 'direction',
  17. 'decorate', 'area', 'age', 'garden', 'district', 'total_price_Num',
  18. 'unit_price_Num', 'area_Num'],
  19. dtype='object')
  20. total_price unit_price roomtype ... total_price_Num unit_price_Num area_Num
  21. 0 29046186元/平米 21厅 ... 290.0 46186 62.79
  22. 1 59976924元/平米 21厅 ... 599.0 76924 77.87
  23. 2 42051458元/平米 21厅 ... 420.0 51458 81.62
  24. 3 269.934831元/平米 22厅 ... 269.9 34831 77.49
  25. 4 38379051元/平米 11厅 ... 383.0 79051 48.45
  26. [5 rows x 13 columns]
  27. total_price unit_price roomtype ... total_price_Num unit_price_Num area_Num
  28. 2995 23043144元/平米 11厅 ... 230.0 43144 53.31
  29. 2996 37275016元/平米 11厅 ... 372.0 75016 49.59
  30. 2997 36649973元/平米 21厅 ... 366.0 49973 73.24
  31. 2998 36569103元/平米 21厅 ... 365.0 69103 52.82
  32. 2999 42049412元/平米 22厅 ... 420.0 49412 85.00
  33. [5 rows x 13 columns]
  34. <class 'pandas.core.frame.DataFrame'>
  35. RangeIndex: 3000 entries, 0 to 2999
  36. Data columns (total 13 columns):
  37. Column Non-Null Count Dtype
  38. --- ------ -------------- -----
  39. 0 total_price 3000 non-null object
  40. 1 unit_price 3000 non-null object
  41. 2 roomtype 3000 non-null object
  42. 3 height 3000 non-null object
  43. 4 direction 3000 non-null object
  44. 5 decorate 3000 non-null object
  45. 6 area 3000 non-null object
  46. 7 age 2888 non-null float64
  47. 8 garden 3000 non-null object
  48. 9 district 3000 non-null object
  49. 10 total_price_Num 3000 non-null float64
  50. 11 unit_price_Num 3000 non-null int64
  51. 12 area_Num 3000 non-null float64
  52. dtypes: float64(3), int64(1), object(9)
  53. memory usage: 304.8+ KB
  54. age total_price_Num unit_price_Num area_Num
  55. count 2888.000000 3000.000000 3000.000000 3000.000000
  56. mean 2001.453601 631.953450 58939.028333 102.180667
  57. std 9.112425 631.308855 25867.208297 62.211662
  58. min 1911.000000 90.000000 11443.000000 17.050000
  59. 25% 1996.000000 300.000000 40267.500000 67.285000
  60. 50% 2003.000000 437.000000 54946.000000 89.230000
  61. 75% 2008.000000 738.000000 73681.250000 119.035000
  62. max 2018.000000 9800.000000 250813.000000 801.140000

2、模型结果输出

  1. AvgModelsR(models=(Pipeline(steps=[('robustscaler', RobustScaler()),
  2. ('lasso',
  3. Lasso(alpha=0.001, random_state=1))]),
  4. Pipeline(steps=[('robustscaler', RobustScaler()),
  5. ('elasticnet',
  6. ElasticNet(alpha=0.001, l1_ratio=0.9,
  7. random_state=3))]),
  8. GradientBoostingRegressor(random_state=5)))
  9. R2_res [0.9944881811696309, 0.000626615309319283, array([0.99470591, 0.99512495, 0.99435729, 0.99491104, 0.99334171])]
  10. MAE_res [-0.004994183753322101, 0.0001083601234287803, array([-0.00493338, -0.005202 , -0.00489054, -0.00498097, -0.00496404])]
  11. RMSE_res [-8.323227156546791e-05, 9.870911328329942e-06, array([-8.14778066e-05, -7.79621763e-05, -7.93078692e-05, -7.49049128e-05,
  12. -1.02508593e-04])]
  13. AvgModelsR(models=(Pipeline(steps=[('robustscaler', RobustScaler()),
  14. ('lasso',
  15. Lasso(alpha=0.001, random_state=1))]),
  16. Pipeline(steps=[('robustscaler', RobustScaler()),
  17. ('elasticnet',
  18. ElasticNet(alpha=0.001, l1_ratio=0.9,
  19. random_state=3))]),
  20. GradientBoostingRegressor(random_state=5)))
  21. Avg_Best_models Score value: 0.9947618159336031
  22. Avg_Best_models R2 value: 0.9947618159336031
  23. Avg_Best_models MAE value: 0.0064209273962331555
  24. Avg_Best_models MSE value: 9.023779248949011e-05
  25. Avg_Best_models模型花费时间: 0:06:14.344069

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=2273
赞同 0
评论 0 条
iakL0
粉丝 0 发表 15 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2935
【软件正版化】软件正版化工作要点  2854
统信UOS试玩黑神话:悟空  2811
信刻光盘安全隔离与信息交换系统  2702
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1235
grub引导程序无法找到指定设备和分区  1205
点击报名 | 京东2025校招进校行程预告  162
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  160
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  156
金山办公2024算法挑战赛 | 报名截止日期更新  153
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!