Py之Crawler:基于requests库+json库实现爬取刘若英2018导演电影《后来的我们》的插曲《再见》张震岳的几十万热评+词云:发现“再见”亦是再也不见


冥王星简单
冥王星简单 2022-09-20 10:04:14 64154
分类专栏: 资讯

Py之Crawler:基于requests库+json库实现爬取刘若英2018导演电影《后来的我们》的插曲《再见》张震岳的几十万热评+词云:发现“再见”亦是再也不见

目录

输出结果

实现代码


输出结果

背景图片

实现代码

  1. -*- coding: utf-8 -*-
  2. Py之Crawler:爬取刘若英2018导演电影《后来的我们》的插曲《再见》张震岳的几十万热评,发现
  3. import requests
  4. import json
  5. url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_185726?csrf_token='
  6. headers = {
  7. 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36',
  8. 'Referer':'http://music.163.com/song?id=185726',
  9. 'Origin':'http://music.163.com',
  10. 'Host':'music.163.com'
  11. }
  12. response = requests.post(url,headers=headers,data=user_data)
  13. data = json.loads(response.text)
  14. hotcomments = []
  15. for hotcommment in data['hotComments']:
  16. item = {
  17. 'nickname':hotcommment['user']['nickname'],
  18. 'content':hotcommment['content'],
  19. 'likedCount':hotcommment['likedCount']
  20. }
  21. hotcomments.append(item)
  22. 获取评论用户名,内容,以及对应的获赞数
  23. content_list = [content['content'] for content in hotcomments]
  24. nickname = [content['nickname'] for content in hotcomments]
  25. liked_count = [content['likedCount'] for content in hotcomments]
  26. 生成图表与词云图
  27. from pyecharts import Bar
  28. bar = Bar("刘若英2018导演电影《后来的我们》的插曲《再见》最新热评——点赞数示例图")
  29. bar.add( "",nickname, liked_count, is_stack=True,mark_line=["min", "max"],mark_point=["average"])
  30. bar.render()
  31. from wordcloud import WordCloud
  32. import matplotlib.pyplot as plt
  33. from scipy.misc import imread
  34. content_text = " ".join(content_list)
  35. bg_pic = imread('F:/File_Python/Resources/heibai04.jpg')
  36. wordcloud = WordCloud(font_path=r"C:\Windows\Fonts\STXINGKA.TTF",max_words=2500,background_color="white",mask=bg_pic,scale=5).generate(content_text) ,max_words=1200,width=1800, height=1200
  37. wordcloud.to_file('zaijian.jpg') 保存词云图
  38. plt.figure()
  39. plt.imshow(wordcloud,interpolation='bilinear')
  40. plt.axis('off')
  41. plt.show()

相关文章
Py之Crawler:爬取刘若英2018导演电影《后来的我们》的插曲《再见》张震岳的几十万热评,发现“再见”亦然是再也不见

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=4022
赞同 0
评论 0 条
冥王星简单L0
粉丝 0 发表 11 + 关注 私信
上周热门
Kingbase用户权限管理  2008
信刻全自动光盘摆渡系统  1738
信刻国产化智能光盘柜管理系统  1408
银河麒麟添加网络打印机时,出现“client-error-not-possible”错误提示  1003
银河麒麟打印带有图像的文档时出错  907
银河麒麟添加打印机时,出现“server-error-internal-error”  699
麒麟系统也能完整体验微信啦!  645
统信桌面专业版【如何查询系统安装时间】  617
统信操作系统各版本介绍  609
统信桌面专业版【全盘安装UOS系统】介绍  583
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

添加我为好友,拉您入交流群!

请使用微信扫一扫!