Crawler：基于urllib库+实现爬虫有道翻译

大白坚定 2022-09-20 11:02:50  61776

分类专栏：资讯

Crawler：基于urllib库+实现爬虫有道翻译

目录

输出结果

后期更新……

设计思路

第一步：首先要知道，data里面的内容是都需要在代码中发送给服务器的。
第二步：理解反爬虫机制，找出加密参数。大多数网站的反爬虫的机制是对向服务器提交表单的动态值进行加密，所以，我们每翻译一次，就观察data里面有哪些参数是动态变化的。从这个网址来看，参数salt、sign对应的值是动态变化。
第三步：找出动态参数的实现方式。根据反爬虫经验可知，一般网站生成的反爬加密值都是采用的时间戳，以及将一下字符串使用加密算法加密一下，我们可以从网页源代码中进行查找理解。

实现步骤

点击有道翻译网页源代码，查看NetWork栏下的相关数据的相关参数：
依次提取url、User-Agent、data
url =
head['User-Agent']=
data =

网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。

本文链接：https://www.xckfsq.com/news/show.html?id=4183

赞同 0

评论 0 条

大白坚定L0

粉丝 0 发表 8 + 关注私信

上周热门: Kingbase用户权限管理  2020; 信刻全自动光盘摆渡系统  1749; 信刻国产化智能光盘柜管理系统  1419; 银河麒麟添加网络打印机时，出现“client-error-not-possible”错误提示  1014; 银河麒麟打印带有图像的文档时出错  924; 银河麒麟添加打印机时，出现“server-error-internal-error”  715; 麒麟系统也能完整体验微信啦！  657; 统信桌面专业版【如何查询系统安装时间】  633; 统信操作系统各版本介绍  624; 统信桌面专业版【全盘安装UOS系统】介绍  598

本周热议: 我的信创开放社区兼职赚钱历程 40; 今天你签到了吗？ 27; 信创开放社区邀请他人注册的具体步骤如下 15; 如何玩转信创开放社区—从小白进阶到专家 15; 方德桌面操作系统 14; 我有15积分有什么用? 13; 用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13; 如何让你先人一步获得悬赏问题信息？（创作者必看） 12; 2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9; 中央国家机关政府采购中心：应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

关注我们

扫一扫关注公众号

添加我为好友，拉您入交流群！


添加我为好友，拉您入交流群！

请使用微信扫一扫!