Crawler：基于urllib库获取cn-proxy代理的IP地址

再见了，我要去远航 2022-09-20 11:02:23  50830

分类专栏：资讯

Crawler：基于urllib库获取cn-proxy代理的IP地址

目录

输出结果

后期更新……

实现代码


import urllib.request
import re 
import os
 
print(os.getcwd())
 
def open_url(url):
    req=urllib.request.Request(url) 
    req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.2.1.17116")
    page=urllib.request.urlopen(req)
    html=page.read().decode("utf-8")
    
    return html
 
def get_img(html):
    p=r'(?:(?:[0,1])?\d?\d|2[0-4]\d|25[0-5]\.){3}(?:[0,1]?\d?\d|2[0-4]\d|25[0-5]))' 
    iplist=re.findall(p,html)
    
    for each in iplist: 
        print(each)
        
    
if __name__=="__mian__":
    url="http://cn-proxy.com"  
    get_img(open_url(url))   
    
url="http://cn-proxy.com"     
get_img(open_url(url))

网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。

本文链接：https://www.xckfsq.com/news/show.html?id=4181

赞同 0

评论 0 条

再见了，我要去远航L0

粉丝 0 发表 11 + 关注私信

上周热门: 如何使用 StarRocks 管理和优化数据湖中的数据？  2966; 【软件正版化】软件正版化工作要点  2885; 统信UOS试玩黑神话：悟空  2855; 信刻光盘安全隔离与信息交换系统  2743; 镜舟科技与中启乘数科技达成战略合作，共筑数据服务新生态  1277; grub引导程序无法找到指定设备和分区  1244; 华为全联接大会2024丨软通动力分论坛精彩议程抢先看！  169; 2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  168; 点击报名 | 京东2025校招进校行程预告  164; 华为纯血鸿蒙正式版9月底见！但Mate 70的内情还得接着挖...  161

本周热议: 我的信创开放社区兼职赚钱历程 40; 今天你签到了吗？ 27; 信创开放社区邀请他人注册的具体步骤如下 15; 如何玩转信创开放社区—从小白进阶到专家 15; 方德桌面操作系统 14; 我有15积分有什么用? 13; 用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13; 如何让你先人一步获得悬赏问题信息？（创作者必看） 12; 2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9; 中央国家机关政府采购中心：应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

关注我们

扫一扫关注公众号

扫一扫加入交流群


加入交流群

请使用微信扫一扫!