爬虫入门案例——爬取免费代理IP

bestproxy • 2022年4月22日 am10:13 • 代理百科

我们在爬取多次对一个网页进行爬取时，网站可能会检测出当前IP非法爬取网页内容，对改IP进行禁止，则，我们就要找到代理IP进行继续爬取。

西刺免费代理IP：xicidaili.com/

源代码如下：

# -*-coding:utf-8-*-"""爬取西刺免费代理IP"""import requestsfrom bs4 import BeautifulSoupwith open(ip.text, a, encoding=utf-8)as f: for page in range(1,3):url=xicidaili.com/nn+/+str(page)headers={User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36}resp=requests.get(url,headers=headers)html=resp.textsoup=BeautifulSoup(html,lxml)all=soup.find_all(tr,class_="odd") for i in all:t=i.find_all(td)ip=t[1].text+:+t[2].textprint(ip)proxies={http:http://+ip,https:https://+ip}targeurl=baidu.com try:response = requests.get(targeurl, proxies=proxies, headers=headers, timeout=5).status_code if response==200:f.write(ip+\n) except:print(改ip不可用)

知识要点：

1、使用requests.get()请求网页

2、通过添加请求头headers破解网页反爬虫

3、使用BeautifulSoup()方法解析网页内容

4、如何快速定位到要爬取的网页内容

5、try……except……用法

（注意事项：文中的网址url因为网站的上传文档的原因，前面的前缀https://www.都被隐藏了）

赞 (0)

如何科学上网【NordVPN】---7200W动态住宅代理IP【Luminati】---适用Shadowsock\Clash等软件的机场，支持ZFB【搬瓦工】

爬虫选择ip代理后——爬虫使用代理ip爬取

« 上一篇 2022年4月22日 am10:12

Python爬虫新手入门教学（十九）：爬取ip代理，构建代理池

下一篇 » 2022年4月22日 am10:14

港股海运板块持续拉升，中远海能涨超7%，中远海控涨超4%，东方海外国际涨近...

港股海运板块持续拉升，中远海能涨超7%，中远海控涨超4%，东方海外国际涨近4%。

代理百科 2022年6月9日
老人说，睡觉时不能“头朝东、脚朝西”，这是为什么？

　　睡眠是我们每天必做的一件事情，保证充足的睡眠，更有助于维持第2天的工作和生活，同时也可以促进身体内脏的修复和排毒。　　近几年伴随着电子产品的普及，越来越多的人形成了熬夜玩手机的习惯，也无法得到充足优质的睡眠，给身体造成了一定的负担。　　　　关于睡眠这件事情，其实自古以来也有很多不同的说法，也许大家应该听家里老一辈的人说过，睡觉的时候不能“头朝东，脚...

代理百科 2022年4月13日
一个司机弄丢考生，一个考生弄丢身份证，最后还是警察最靠谱

　　警车送考生回宾馆　　扬子晚报网6月7日讯（通讯员晓兰明宝兆俐馨嬛记者陈咏）高考到来，考生该带的东西一样不能少，当然更不能把考生“弄丢”。7日，高邮、江都两地2个考生出现紧急状况，好在警方及时出手援助，考生无忧。　　7日上午，高邮汇富大酒店门口，一名高考考生向帮助他的辅警叔叔作揖，连声感谢。原来，当天上午11时30分许，高考首门语文考试结束...

代理百科 2022年6月9日
运营缅甸、柬埔寨赌博网站,32名客服及代理在国内被抓!

近日，河南省淮滨县公安局破获一起涉案数千万元的跨境赌博案，32名犯罪嫌疑人全部到案。　　经查，该团伙租用香港服务器，在缅甸、柬埔寨设立操作平台，赌徒联系网站客服后，可以通过网银转账等方式在“金御会”App内投注赌博，涉案流水资金达数千万元，国内代理、赌徒共计千余人。　　鉴于该网络赌博平台窝点、服务器在境外，但平台客服、代理均在境内的特点，专案组...

代理百科 2022年6月2日
投资者提问：请问公司是否关注国外同行新冠药上市，是否考虑拿到大中华地区代理...

投资者提问：请问公司是否关注国外同行新冠药上市，是否考虑拿到大中华地区代理？董秘回答(金陵药业SZ)：投资者，您好！感谢您对公司的关心以及所提出的意见与建议。谢谢！查看更多董秘问答>> 免责声明：本信息由新浪财经从公开信息中摘录，不构成任何投资建议；新浪财经不保证数据的准确性，内容仅供参考。 .app-kaihu-qr {text-ali...

代理百科 2022年5月14日
谷歌SEO_如何进行SEO日志文件分析_

在过去五年中，日志文件越来越受到技术 SEO 的认可，这是有充分理由的。它们是了解搜索引擎已抓取的 URL 的最值得信赖的信息来源，这可能是帮助诊断技术 SEO 问题的关键信息。Google 本身也意识到了它们的重要性，在 Google Search Console 中发布了新功能，并且可以轻松查看以前只能通过分析日志才能获得的数据样本。此外...

代理百科 2022年5月16日