HTTP代理与HTTPS代理都是目前较为常用的代理IP协议类型,它们的代理服务器架设在用户客户端与站点服务器之间,作为信息的“中转站”来处理双方发来的信息。用户可以通过代理服务器来隐藏自身真实的IP地址,而站点发来的数据也可以保留在代理服务器的缓存区中以便之后的重复提取。
HTTP代理工作流程:
1. 客户端浏览器将请求原封不动的发送给代理服务器
2. 代理服务器从Http标头中获取目标的主机地址,将请求发送给目标主机
3、目标主机将响应回传给代理服务器
4、代理服务器将响应回传给客户端浏览器。
对于客户端浏览器来说,代理服务器就是目标web服务器。
对于web服务器来说,它会把代理当做客户端,完全察觉不到真正客户端的存在。
HTTPS代理工作流程
1、浏览器首先发送HTTP Connect请求给代理服务器,发送目标主机信息。
2、代理服务器建立和目标主机的TCP链接,并向浏览器回应Connection Established应答。
3、浏览器将请求发送给代理服务器,代理服务器透传给目标主机。
4、目标主机将响应回给代理服务器,代理服务器将响应回给浏览器。
HTTP和HTTPS的主要区别
HTTPS协议需要到CA申请证书,一般免费证书较少,因而需要一定费用。HTTP是超文本传输协议,信息是明文传输,HTTP则是具有安全性的SSL加密传输协议。HTTP和HTTPS使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。HTTP协议的连接是无状态的,而HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,因此比http协议安全。
IPIDEA已向众多互联网知名企业提供服务,对提高爬虫的抓取效率提供帮助,支持API批量使用,支持多线程高并发使用。
欢迎访问www.ipidea.netwww.ipidea.net/?utm-source=lqy&utm-keyword=%3Flqy