Python爬取大量数据时，如何防止IP被封

bestproxy • 2022年6月15日 am1:18 • 代理百科

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者： By

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

爬取了猪八戒上的一些数据可能是由于爬取的数据量有点多吧，结果我的IP被封了，需要自己手动来验证解封ip,但这显然阻止了我爬取更多的数据了。

下面是我写的爬取猪八戒的被封IP的代码

如何防止爬取数据的时候被网站封IP这里有一些套路.查了一些套路

1.修改请求头

之前的爬虫代码没有添加头部，这里我添加了头部，模拟成浏览器去访问网站

2.采用代理IP

当自己的ip被网站封了之后，只能采用代理ip的方式进行爬取，所以每次爬取的时候尽量用代理ip来爬取，封了代理还有代理。

生成代理ip,大家可以直接把这个代码拿去用

好了我用上面的代码给我生成了一批ip地址（有些ip地址可能无效，但只要不封我自己的ip就可以了,哈哈），然后我就可以在我的请求头部添加ip地址

给我们的请求添加代理ip

最后完整代码如下：

数据全部爬取出来了，且我的IP也没有被封。当然防止被封IP肯定不止这些了，这还需要进一步探索!

赞 (0)

如何科学上网【NordVPN】---7200W动态住宅代理IP【Luminati】---适用Shadowsock\Clash等软件的机场，支持ZFB【搬瓦工】

代理IP的四大用途

« 上一篇 2022年6月15日 am1:10

爬虫技术的使用是如何判定合法还是违法_

下一篇 » 2022年6月15日 am2:29

Warning: Undefined array key "related_news" in /www/wwwroot/bestproxy.cc/wp-content/themes/justnews/single.php on line 200

最新国内代理ip地址分享

网络时代使用最新的互联网技术可以帮助人们更高效地工作和生活，但同时也给一些人设置了障碍，如当一个人需要在许多网站上注册时很容易丢失密码或注册失败。这时您就会想到代理ip，这是一项新技术，主要针对互联网注册开发技术，由服务提供商提供的代理技术非常流行。 182.134.157.82:9999 [未知] 中国-四川-达州--电信 HTTP代理IP 49.88.1...

代理百科 2022年3月6日
电脑明明有网络，但是浏览器网页就是打不开怎么回事？

设置——网络和Internet——代理，把“使用代理服务器”给关掉找了好久才解决电脑ping一下百度试试，如果ping不通那就是DNS服务器出问题了；ping的通就看一下是不是浏览器设置过什么

代理百科 2022年7月16日
关于防火墙的知识你了解多少

一、什么是防火墙？我们知道，原是指古代人们房屋之间修建的那道墙，这道墙可以防止火灾发生的时候蔓延到别的房屋。而这里所说的防火墙当然不是指物理上的防火墙，而是指隔离在本地网络与外界网络之间的一道防御系统，其实原理是一样的，也就是防止灾难扩散。应该说，在互联网上防火墙是一种非常有效的网络安全模型，通过它可以隔离风险区域(即Internet或有一定风险的网络)...

代理百科 2022年3月26日
小南看展_所得＞所见？带好镜头，杨牧石最新作品登陆广州K11啦

4月1日，新锐艺术家杨牧石的华南首展“单面拼接”在广州K11开幕。展览由知名策展人冯博一策划，共呈现163件几何体所拼接出的装置品，展示了杨牧石从2016年至今的创作。镜头内外，同件作品的颜色竟然全不同，这到底是什么情况？赶紧跟着小南一探究竟！小南看展 | 所得＞所见？带好镜头，杨牧石最新作品登陆广州K11啦00:0001:38打开凤凰新闻客户端提升3...

代理百科 2022年4月20日
毒代理——绕过HTTPS和VPN黑掉你的在线身份

研究人员证明，代理设置漏洞暴露 HTTPS URL，黑客可肆意发起攻击。该漏洞影响绝大多数操作系统和Web浏览器，可被用于渗漏 HTTPS URL 及进行各种恶意活动。该攻击依赖于代理自动配置(PAC)文件，也就是指定Web浏览器和其他用户代理如何处理HTTP、HTTPS和FTP流量的文件。PAC文件使用名为FindProxyForURL的JavaScri...

代理百科 2022年3月26日
反向代理服务器_为什么用,怎么用,如何用_

简介我们大多数人都熟悉一些代理服务器：正向代理反向代理在访问资源的客户端（用户代理）的上下文中可以看到“转发”和“反向”。资源可以（不限于）：通常是网站或服务器节点 FTP服务器为什么用？让我们来举一个名叫QWERTY的样板组织之例，并且基础架构团队已经定义了如下的策略：任何访问互联网的人都须遵守组织中定义的规则。访问基础结构中托管服务的任...

代理百科 2022年3月23日