匿名代理是Internet免费爬虫代理ip用户中最受欢迎的代理类型。它是不透明的,将您的IP地址更改为另一个IP地址来请求数据。这使网站很难知道您是发起请求的,但网站能检测到你使用了代理。
将IP地址更改为一个全新的地址,将自己标识为代理,是通过修改REMOTE_ADDR、HTTP_X_FORWARDED_FOR和HTTP_VIA来完成的。当您使用匿名代理时,网站所有者知道您正在使用“HTTP_VIA”代理,但无法知道您的真实IP。
REMOTE_ADDR=代理IP地址
HTTP_VIA=代理IP地址
HTTP_X_FORWARDED_FOR=代理IP地址
匿名代理的工作原理
代理服务器将位于您的计算机浏览器和Internet之间。当您发出Web请求时,您将被重定向到代理服务器,而不是直接访问您打算访问的站点。到达代理服务器后,您的请求标头将被修改。正是这种修改使其匿名。
HTTP代理修改HTTP_X_FORWARDED_FOR和REMOTE_ADDR标头,去除您的IP地址并用它自己的IP地址填充它。在此之后,请求被发送到网站——因为发送了HTTP_VIA标头,网站将知道使用了代理,但不会看到您的IP地址。发送响应时,它不会直接发送给您,而是发送给代理服务器,然后代理服务器将请求转发给您。