ML之xgboost：利用xgboost算法(sklearn+GridSearchCV)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)

晴空万里 2022-09-19 14:44:18  50195

分类专栏：资讯

输出结果

正在更新……

设计思路

正在更新……

核心代码


from sklearn.grid_search import GridSearchCV
 
param_test = { 'n_estimators': range(1, 51, 1)}
clf = GridSearchCV(estimator = bst, param_grid = param_test, cv=5)
clf.fit(X_train, y_train)
clf.grid_scores_, clf.best_params_, clf.best_score_
 
 
 
grid_scores_mean= [0.90542,  0.94749,  0.90542,  0.94749,  0.90573,  0.94718, 
                   0.90542,  0.94242,  0.94473,  0.97482,  0.94887,  0.97850, 
                   0.97298,  0.97850,  0.97298,  0.97850,  0.97850,  0.97850, 
                   0.97850,  0.97850,  0.97850,  0.97850,  0.97850,  0.97850, 
                   0.97850,  0.97804,  0.97774,  0.97835,  0.98296,  0.98419,    
                   0.98342,  0.98372,  0.98419,  0.98419,  0.98419,  0.98419, 
                   0.98419,  0.98419,  0.98419,  0.98419,  0.98419,  0.98419, 
                   0.98419,  0.98419,  0.98419,  0.98419,  0.98419,  0.98419, 
                   0.98419 ]
 
 
grid_scores_std = [0.08996,  0.07458,  0.08996,  0.07458,  0.09028,  0.07436,  
                   0.08996,  0.07331,  0.07739,  0.02235,  0.07621,  0.02387,  
                   0.03186,  0.02387,  0.03186,  0.02387,  0.02387,  0.02387,  
                   0.02387,  0.02387,  0.02387,  0.02387,  0.02387,  0.02387,  
                   0.02387,  0.02365,  0.02337,  0.02383,  0.01963,  0.02040,  
                   0.01988,  0.02008,  0.02040,  0.02040,  0.02040,  0.02040,  
                   0.02040,  0.02040,  0.02040,  0.02040,  0.02040,  0.02040,  
                   0.02040,  0.02040,  0.02040,  0.02040,  0.02040,  0.02040,  
                   0.02040  ]
 
 
7-CrVa交叉验证曲线可视化
import matplotlib.pyplot as plt
 
x = range(0,len(grid_scores_mean))
y1 = grid_scores_mean
y2 = grid_scores_std
Xlabel = 'n_estimators'
Ylabel = 'value'
title = 'mushroom datase: xgboost(sklearn+GridSearchCV) model'
 
plt.plot(x,y1,'r',label='Mean')                      绘制mean曲线
plt.plot(x,y2,'g',label='Std')                       绘制std曲线
 
plt.rcParams['font.sans-serif']=['Times New Roman']  手动添加中文字体，或者['font.sans-serif'] = ['FangSong']   SimHei
myfont = matplotlib.font_manager.FontProperties(fname='C:/Windows/Fonts/msyh.ttf')  也可以指定win系统字体路径
plt.rcParams['axes.unicode_minus'] = False  对坐标轴的负号进行正常显示
 
plt.xlabel(Xlabel)
plt.ylabel(Ylabel)
plt.title(title)
 
plt.legend(loc=1)   
plt.show()

更多输出


GridSearchCV time： 79.7655139499154
clf.grid_scores_： [mean: 0.90542, std: 0.08996, params: {'n_estimators': 1}, mean: 0.94749, std: 0.07458, params: {'n_estimators': 2}, 
                   mean: 0.90542, std: 0.08996, params: {'n_estimators': 3}, mean: 0.94749, std: 0.07458, params: {'n_estimators': 4}, 
                   mean: 0.90573, std: 0.09028, params: {'n_estimators': 5}, mean: 0.94718, std: 0.07436, params: {'n_estimators': 6}, 
                   mean: 0.90542, std: 0.08996, params: {'n_estimators': 7}, mean: 0.94242, std: 0.07331, params: {'n_estimators': 8}, 
                   mean: 0.94473, std: 0.07739, params: {'n_estimators': 9}, mean: 0.97482, std: 0.02235, params: {'n_estimators': 10}, 
                   mean: 0.94887, std: 0.07621, params: {'n_estimators': 11}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 12}, 
                   mean: 0.97298, std: 0.03186, params: {'n_estimators': 13}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 14}, 
                   mean: 0.97298, std: 0.03186, params: {'n_estimators': 15}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 16}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 17}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 18}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 19}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 20}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 21}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 22}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 23}, mean: 0.97850, std: 0.02387, params: {'n_estimators': 24}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 25}, mean: 0.97804, std: 0.02365, params: {'n_estimators': 26}, 
                   mean: 0.97774, std: 0.02337, params: {'n_estimators': 27}, mean: 0.97835, std: 0.02383, params: {'n_estimators': 28}, 
                   mean: 0.98296, std: 0.01963, params: {'n_estimators': 29}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 30}, 
                   mean: 0.98342, std: 0.01988, params: {'n_estimators': 31}, mean: 0.98372, std: 0.02008, params: {'n_estimators': 32}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 33}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 34}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 35}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 36}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 37}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 38}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 39}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 40}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 41}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 42}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 43}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 44}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 45}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 46}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 47}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 48}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 49}, mean: 0.98419, std: 0.02040, params: {'n_estimators': 50}]
clf.best_params_： {'n_estimators': 30}
clf.best_score_： 0.9841854752034392


[mean: 0.90542, std: 0.08996, params: {'n_estimators': 1}, 
                   mean: 0.94749, std: 0.07458, params: {'n_estimators': 2}, 
                   mean: 0.90542, std: 0.08996, params: {'n_estimators': 3}, 
                   mean: 0.94749, std: 0.07458, params: {'n_estimators': 4}, 
                   mean: 0.90573, std: 0.09028, params: {'n_estimators': 5}, 
                   mean: 0.94718, std: 0.07436, params: {'n_estimators': 6}, 
                   mean: 0.90542, std: 0.08996, params: {'n_estimators': 7}, 
                   mean: 0.94242, std: 0.07331, params: {'n_estimators': 8}, 
                   mean: 0.94473, std: 0.07739, params: {'n_estimators': 9}, 
                   mean: 0.97482, std: 0.02235, params: {'n_estimators': 10}, 
                   mean: 0.94887, std: 0.07621, params: {'n_estimators': 11}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 12}, 
                   mean: 0.97298, std: 0.03186, params: {'n_estimators': 13}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 14}, 
                   mean: 0.97298, std: 0.03186, params: {'n_estimators': 15}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 16}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 17}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 18}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 19}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 20}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 21}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 22}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 23}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 24}, 
                   mean: 0.97850, std: 0.02387, params: {'n_estimators': 25}, 
                   mean: 0.97804, std: 0.02365, params: {'n_estimators': 26}, 
                   mean: 0.97774, std: 0.02337, params: {'n_estimators': 27}, 
                   mean: 0.97835, std: 0.02383, params: {'n_estimators': 28}, 
                   mean: 0.98296, std: 0.01963, params: {'n_estimators': 29}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 30}, 
                   mean: 0.98342, std: 0.01988, params: {'n_estimators': 31}, 
                   mean: 0.98372, std: 0.02008, params: {'n_estimators': 32}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 33}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 34}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 35}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 36}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 37}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 38}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 39}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 40}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 41}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 42}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 43}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 44}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 45}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 46}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 47}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 48}, 
                   mean: 0.98419, std: 0.02040, params: {'n_estimators': 49}]
 
 
grid_scores_ = [mean: 0.90542, std: 0.08996, 
                   mean: 0.94749, std: 0.07458, 
                   mean: 0.90542, std: 0.08996, 
                   mean: 0.94749, std: 0.07458, 
                   mean: 0.90573, std: 0.09028, 
                   mean: 0.94718, std: 0.07436,
                   mean: 0.90542, std: 0.08996, 
                   mean: 0.94242, std: 0.07331, 
                   mean: 0.94473, std: 0.07739,  
                   mean: 0.97482, std: 0.02235,
                   mean: 0.94887, std: 0.07621, 
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97298, std: 0.03186,  
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97298, std: 0.03186,  
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387,  
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387,
                   mean: 0.97850, std: 0.02387, 
                   mean: 0.97850, std: 0.02387,
                   mean: 0.97804, std: 0.02365,  
                   mean: 0.97774, std: 0.02337, 
                   mean: 0.97835, std: 0.02383, 
                   mean: 0.98296, std: 0.01963, 
                   mean: 0.98419, std: 0.02040,  
                   mean: 0.98342, std: 0.01988, 
                   mean: 0.98372, std: 0.02008, 
                   mean: 0.98419, std: 0.02040,  
                   mean: 0.98419, std: 0.02040,  
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040, 
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040,
                   mean: 0.98419, std: 0.02040, 

            网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。
          
        本文链接：https://www.xckfsq.com/news/show.html?id=3066
          
            
              赞同  0
            
            
              反对  0
            
          
      
      
      
        评论 0 条
        
		              
		    
        
              
      
      
        相关文章
        
                    
            ML之LoR：基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以toad框架全流程讲解
            2022-09-19
            52362 浏览
            
        
       
                
                    ML之LoR：基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以
          
                    
            DataScience：基于GiveMeSomeCredit数据集利用特征工程处理、逻辑回归LoR算法实现构建风控中的金融评分卡模型
            2022-09-19
            53993 浏览
            
        
       
                
                    DataScience：基于GiveMeSomeCredit数据集利用特征工程处理、逻辑回
          
                    
            ML之LoR：基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解
            2022-09-19
            51529 浏览
            
        
       
                
                    ML之LoR：基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以
          
                    
            TF之DD：利用Inception模型+GD算法生成带背景的大尺寸、高质量的Deep Dream图片——五个架构设计思维导图
            2022-09-19
            48492 浏览
            
        
       
                
                    TF之DD：利用Inception模型+GD算法生成带背景的大尺寸、高质量的Deep Dr
          
                    
            DL之GRU：基于2022年6月最新上证指数数据集结合Pytorch框架利用GRU算法预测最新股票上证指数实现回归预测
            2022-09-19
            50068 浏览
            
        
       
                
                    DL之GRU：基于2022年6月最新上证指数数据集结合Pytorch框架利用GRU算法预测
          
                    
            DataScience&ML：基于heart disease心脏病分类预测数据集利用决策数算法基于graphviz/eli5/pdpbox/shap库实现模型可解释性(全局/部分/局部解释)之详细攻略
            2022-09-19
            48901 浏览
            
        
       
                
                    DataScience&ML：基于heart disease心脏病分类预测数据集利
          
                    
            DL之DNN：基于sklearn自带california_housing加利福尼亚房价数据集利用GD神经网络梯度下降算法进行回归预测(数据较多时采用mini-batch方式训练会更快)
            2022-09-19
            51835 浏览
            
        
       
                
                    DL之DNN：基于sklearn自带california_housing加利福尼亚房价数据
          
                    
            DL之GRU(Tensorflow框架)：基于茅台股票数据集利用GRU算法实现回归预测(保存模型.ckpt.index、.ckpt.data文件)
            2022-09-19
            49028 浏览
            
        
       
                
                    DL之GRU(Tensorflow框架)：基于茅台股票数据集利用GRU算法实现回归预测(保
          
                    
            ML之PFI(eli5)：基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
            2022-09-19
            50615 浏览
            
        
       
                
                    ML之PFI(eli5)：基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要
          
                    
            ML之mlxtend：基于iris鸢尾花数据集利用逻辑回归LoR/随机森林RF/支持向量机SVM/集成学习算法结合mlxtend库实现模型可解释性
            2022-09-19
            50773 浏览
            
        
       
                
                    ML之mlxtend：基于iris鸢尾花数据集利用逻辑回归LoR/随机森林RF/支持向量机


    
    
      
        
          
            
              
            
          
          
            晴空万里L0
          
          
            粉丝 0
            发表 11
                        + 关注
                        私信
          
        
      
            
    上周热门
        
        如何使用 StarRocks 管理和优化数据湖中的数据？
         2941
    
        
        【软件正版化】软件正版化工作要点
         2860
    
        
        统信UOS试玩黑神话：悟空
         2819
    
        
        信刻光盘安全隔离与信息交换系统
         2712
    
        
        镜舟科技与中启乘数科技达成战略合作，共筑数据服务新生态
         1246
    
        
        grub引导程序无法找到指定设备和分区
         1213
    
        
        华为全联接大会2024丨软通动力分论坛精彩议程抢先看！
         163
    
        
        点击报名 | 京东2025校招进校行程预告
         162
    
        
        2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办
         160
    
        
        华为纯血鸿蒙正式版9月底见！但Mate 70的内情还得接着挖...
         157
    
    

    本周热议
        
        我的信创开放社区兼职赚钱历程
         40
    
        
        今天你签到了吗？
         27
    
        
        信创开放社区邀请他人注册的具体步骤如下
         15
    
        
        如何玩转信创开放社区—从小白进阶到专家
         15
    
        
        方德桌面操作系统
         14
    
        
        我有15积分有什么用?
         13
    
        
        用抖音玩法闯信创开放社区——用平台宣传企业产品服务
         13
    
        
        如何让你先人一步获得悬赏问题信息？（创作者必看）
         12
    
        
        2024中国信创产业发展大会暨中国信息科技创新与应用博览会
         9
    
        
        中央国家机关政府采购中心：应当将CPU、操作系统符合安全可靠测评要求纳入采购需求
         8
    
    

    热门标签更多
    
        
                        运维
                        银河麒麟
                        安全
                        国产数据库
                        信创知识
                        信创硬件
                        后端
                        Windows
                        鸿蒙
                        信创外设
                        AI(人工智能)
                        统信UOS
                        国产办公软件
                        国产操作系统
                        中间件
                        前端
                        校园招聘
                        国产设计软件
                        软件正版化
                    
    


    
        
                        关于社区
                        使用帮助
                        招贤纳士




    
		
		
		
		
		
			
			
			 登录 
			 注册 
		
	      
        菜单
        
        
						
				
					 资源 
				
			
						
				
					 问题 
				
			
						
				
					 资讯 
				
			
						
				
					 人才 
				
			
						
				
					 活动 
				
			
						
				
					 畅所欲言 
				
			
						
				
					 AI 
				
			
					  
            
              
                 回首页
                index
              
            
           
        
      
    



  
    
      菜单
      
      
        
          
             首页 
          
        
                
          
             资源 
          
        
                
          
             问题 
          
        
                
          
             资讯 
          
        
                
          
             人才 
          
        
                
          
             活动 
          
        
                
          
             畅所欲言 
          
        
                
          
             AI 
          
        
              
    
  


  
    信创开放社区    Copyright © 2024 
    渝ICP备15002787号-10
    渝公网安备50010702506279
        关于社区
        使用帮助
        招贤纳士
        友情链接：
        重庆市软件正版化服务平台
        信创参考
        信创产业网
        重庆享动科技有限公司
      


  
    
    
      关注我们
      
        
          
          扫一扫关注公众号
        
        
          
          扫一扫加入交流群
        
      
    
  
  




  加入交流群
  
  请使用微信扫一扫!