以下是一个简单的Python爬虫代码示例,用于从指定的URL抓取网页内容并打印出来:
import requests
def get_html(url):
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
print("Failed to get the HTML content of the page.")
return None
def main():
url = "https://www.example.com" # 替换为你要爬取的网页URL
html = get_html(url)
if html is not None:
print(html)
if __name__ == "__main__":
main()
这个代码使用了requests
库来发送HTTP请求并获取网页内容。在get_html()
函数中,我们发送GET请求到指定的URL,并检查响应状态码是否为200。如果是,则返回响应的HTML内容;否则,打印一条错误消息并返回None。在main()
函数中,我们调用get_html()
函数来获取指定URL的HTML内容,并打印出来。
如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!
加入交流群
请使用微信扫一扫!