6,搭建免费代理池

requests模拟发送http请求,频率限制---》变换ip---》代理(免费,收费)---》

搭建代理池---》开源(参照:python,flask+爬虫)

通过爬虫去免费网站爬取 免费代理--》验证一下---》存到库中(redis)--->请求一个接口,就随机返回一个代理地址

搭建步骤 ### 第一步:下载代码 git clone [email protected]:jhao104/proxy_pool.git ### 第二步:安装依赖 pip3install -r requirements.txt ### 第三步:修改配置--》项目路径下的settings.py # 配置API服务 HOST = "0.0.0.0" # IP PORT = 5000# 监听端口 # 配置数据库 DB_CONN = redis://127.0.0.1:8888/0 # 配置 ProxyFetcher--->配置爬取哪几个免费代理的网站 PROXY_FETCHER = [ "freeProxy01",# 这里是启用的代理抓取方法名,所有fetch方法位于fetcher/proxyFetcher.py "freeProxy02", # .... ] ### 第四步,启动项目 # 启动调度程序(爬取代理) python3 proxyPool.py schedule # 启动webApi服务(提供接口) python3 proxyPool.py server

使用代理池

#1使用代理池 import requests # res=requests.get(:5010/get/) # print(res.json()[proxy]) # # # ## 咱们的爬虫,随机使用代理去访问 # proxies={ # http:res.json()[proxy] # } # respone=requests.get( #proxies=proxies) # # print(respone.status_code)