DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)


彪壮等于芹菜
彪壮等于芹菜 2022-09-19 11:28:05 52623
分类专栏: 资讯

DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)

目录

利用pandas库统计某一列col中各个值出现的次数(降序输出)

输出结果

实现代码


利用pandas库统计某一列col中各个值出现的次数(降序输出)

输出结果

  1. Save success! F:\File_Python\Resources\data_csv_xls\demo_dataset\data_test01.csv
  2. <class 'pandas.core.frame.DataFrame'>
  3. RangeIndex: 6 entries, 0 to 5
  4. Data columns (total 11 columns):
  5. Column Non-Null Count Dtype
  6. --- ------ -------------- -----
  7. 0 Name 6 non-null object
  8. 1 Sex 6 non-null object
  9. 2 Age 6 non-null int64
  10. 3 Age02 5 non-null float64
  11. 4 Capitalisation 6 non-null object
  12. 5 Capitalisation02 6 non-null object
  13. 6 Education 6 non-null object
  14. 7 Company 6 non-null object
  15. 8 StockMarket 6 non-null object
  16. 9 Score 6 non-null int64
  17. 10 Others 6 non-null object
  18. dtypes: float64(1), int64(2), object(8)
  19. memory usage: 656.0+ bytes
  20. None
  21. Unnamed: 0 Name Sex Age Age02 ... Education Company StockMarket Score Others
  22. 0 0 马云 男 56 56.0 ... 1 阿里巴巴 美股 3 150
  23. 1 1 马化腾 男 49 49.0 ... 1 腾讯 港股 2 200
  24. 2 2 李彦宏 男 51 51.0 ... 2 百度 美股 -3 50
  25. 3 3 刘强东 男 47 47.0 ... 1 京东 美股 -8 0
  26. 4 4 董明珠 女 66 66.0 ... 2 格力 A股 -2 300
  27. [5 rows x 12 columns]
  28. T1、统计某一【类别型】列StockMarket中各个值出现的次数:
  29. 美股 3
  30. A股 1
  31. 未上市 1
  32. 港股 1
  33. Name: StockMarket, dtype: int64
  34. T2、统计某一【类别型】列StockMarket中各个值出现的次数:
  35. 美股 2
  36. 港股 1
  37. Name: StockMarket, dtype: int64

实现代码

  1. DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)
  2. import pandas as pd
  3. from NDataScience.Makedata import data2csv
  4. data_frame=pd.read_csv('F:\File_Python\Resources\data_csv_xls\demo_dataset\data_test01.csv')
  5. print(data_frame.head())
  6. CatColumn_name='StockMarket'
  7. print('统计某一【类别型】列%s中各个值出现的次数:'%CatColumn_name,'\n',data_frame[CatColumn_name].value_counts()[:4])
  8. print('统计某一【类别型】列%s中各个值出现的次数:'%CatColumn_name,'\n',data_frame[CatColumn_name].head(3).value_counts())
  9. data_frame[CatColumn_name].value_counts().plot(kind='bar')
  10. plt.xlabel(CatColumn_name)
  11. plt.xticks(rotation=0)
  12. plt.title('Distribution of category type columns')
  13. plt.show()
文章知识点与官方知识档案匹配,可进一步学习相关知识

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=2063
赞同 0
评论 0 条
彪壮等于芹菜L0
粉丝 0 发表 5 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2935
【软件正版化】软件正版化工作要点  2854
统信UOS试玩黑神话:悟空  2811
信刻光盘安全隔离与信息交换系统  2702
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1235
grub引导程序无法找到指定设备和分区  1205
点击报名 | 京东2025校招进校行程预告  162
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  160
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  156
华为纯血鸿蒙正式版9月底见!但Mate 70的内情还得接着挖...  154
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!