我的应用到底需要多少代理?

“我的应用到底需要多少代理?”,这个问题的答案取决于具体情况。

实际上,这是大多数与代理相关的问题的答案,因为代理本质上是基于情况的概念。许多人不使用代理,不知道它们是什么,也不知道它们所管理的世界有多少。

如果您正在考虑应用程序的代理,那么代理的数量将完全取决于您的情况,应用程序是什么,您使用应用程序的目的是什么,以及您愿意承担多大的风险。

让我们开始吧!


越多越好

考虑成功运行应用程序所需的代理数量时,有几个关键因素,但是一种心态胜过所有这些。在代理方面,越多越好

为什么?好吧,首先需要代理的主要原因是要成功隐藏您的匿名性。虽然隐藏个人的浏览习惯很简单,并且可能在必要时使用单个代理(或VPN)完成,但大多数人都在尝试做更多的事情。大多数人都在尝试收集数据自动化社交媒体在互联网上建立防御机制

在执行这些更复杂的任务时,您总是会遇到代理使用中固有的风险。一种风险是您的代理将被列入黑名单或被禁止,因此您将需要新的代理。

或者,更糟糕的是,您的代理将以某种方式追溯到您,并且您的实际IP地址将被列入黑名单或被禁止。第二种情况并不经常发生,但是如果您不安全,则很有可能发生。

针对这两种情况的最佳方法—购买或找到大量代理,然后将其用于一切。越多越好,因为您使用的代理越多,您的应用程序可以不断运行的越多,并且个人越安全。


付费代理

“越多越好”的现实是有局限性的,并且仅仅为了保护自己而大量购买代理并不是经济上的举措。我将在下面讨论免费代理,但在这一节中,我将介绍在许多场景和应用程序中需要多少付费代理。

正如我之前所写的,这要视情况而定。如果你只是想在不同的IP地址下浏览网页,试着找到1-3个代理来做这件事。你甚至不需要一个应用程序——在大多数情况下,你只需要将代理IP地址和登录信息插入web浏览器或计算机系统设置。互联网会认为你在别的地方,你可以自由地匿名浏览。

对于那些想要以更精确的方式使用代理的人,比如抓取谷歌或者购买限量版耐克,付费代理是唯一的选择。你可以用免费的公共代理来做这两件事,但是私有代理会更快更可靠。

您可以使用两种类型的付费代理:精英私人代理共享代理


精英私人代理

购买精英私人代理的最有帮助的建议是购买10个并试用。当然,这10个代理需要绝对私有(其他任何人都不能使用)。

另外,请与您的代理提供商联系,以查看交付的代理是否为纯代理。原始代理是全新的,而且最重要的是,Google和其他IP标语看不到该代理。

这一点很重要,因为纯代理比以前使用过的代理被禁止的可能性要小得多。更重要的是,如果一个IP以前被禁止过,那么每次并发时它被禁止的速度更快,时间也更长。

在各种应用中试用了10个代理之后,对结果进行排序。他们快吗?他们超时了吗?他们被禁止了吗?购买付费专用代理最好的地方是,你通常可以免费向供应商请求新的代理。不过,请不要滥用此政策- 如果您每30分钟烧掉10个代理并请求新的代理,提供商可能会丢弃您

你也可以以相对便宜的价格买到一批10个,通常每月不到30美元。如果你搜集或转售的高端产品超过了每月的投资,你就万事俱备了。


共享私人代理

共享是自由和私人之间的中间地带。有些人永远不会使用它们,但对于许多应用程序来说,它们工作得非常出色。

基本上,共享代理是您必须为其他人也在使用的代理付费。有多少其他人取决于提供商,但是只要代理具有不错的上载和下载速度,这不是一个大问题。

这样做的目的是希望其他用户不会禁止共享代理,但是很难信任其他从未与您交互过的匿名代理用户。

共享代理的优点是与精英私人代理相比便宜得多。您可以将单个共享代理的价格降低到每月不足1美元,但通常必须批量购买。

如果您要使用共享代理路线,建议您购买100-150个代理。数量的激增是由于未知的质量,你与谁共享代理,以及他们使用了多少数据。

如果一个代理上有五个人每天24小时都在使用它来获取大量数据包,连接就会变慢。因此,你将需要很多代理来获得与私有代理相同的速度。此外,共享代理更有可能被禁止,因为它们的过度使用,因此拥有大量代理可以确保您有备份。


不要让你的代理超负荷工作

上面提到的两个数字(10个精英私人代理或100-150个共享代理)是您可以尝试的基本数字。这些数字可能足以满足您的目的,但前提是您要坚持谨慎和合理的方法。

间隔间距

大多数应用程序具有无数的选项和设置,这些选项和设置限制了使用单个代理的频率。这些非常重要。

在特定的应用程序(例如ScrapeBox)中,很容易在单个ping的各个ping之间拨入您想要的秒数

一般而言,强烈建议您这样做,如果代理数量少,则必须这样做。同样,该数量在很大程度上取决于您的特定用例,但是通常来说10-14秒的延迟是标准且谨慎的。

每次使用代理时,它都会增加它在网络上的存在,如果您不小心,则会被过度使用标记为代理。如果您确实不希望发生这种情况,请将间隔设置为一分钟或更长。这样一来,您就可以昼夜不停地运行它们,而不必担心代理被禁止。

设置ping的间隔是一种要采取的措施-另一种方法是掌握线程和连接的状态。线程或连接是您实际拥有多少个传输信息的通道。代理只是尝试连接到其他IP地址的IP地址。

线程是信息传播的通道,通常由您的ISP或代理提供商确定。检查这两者,以确定您可以访问多少个线程,这样就不会使它们烦恼。线程和连接通常也可以在流行的应用程序(例如ScrapeBox或GSA)的API中进行配置。

非官方的“ScrapeBox常见问题解答”—它本身就是一个有用的资源—建议每个打开的连接至少有20-30个代理。同样,这将根据您的具体情况而改变,但单个连接也可以用于10个代理。

但是,我还要指出,这是另一个要谨慎的地方。许多人将线程与代理的比率保持为1:1。如果每个代理都有自己的线程,它将看起来更像是普通用户,而不是代理对数据进行抓取。对于某些人来说,这似乎有些过分,但这将有助于确保您的代理不会被禁止。

1:1比率很好的例子是,如果您将代理与电子邮件和电子邮件帐户一起使用。垃圾邮件代理的电子邮件营销是不合法的(所以不要这样做),但你仍然可以使用他们打开电子邮件帐户和点击链接在一个合法的方式。

这样做将使您面临Google的机器人检测方法。这里你需要1:1的比例,因为你的IP地址不仅来自数据中心,他而且它们将以非人工方式使用电子邮件。


免费代理

我上面讨论的所有内容都与付费代理有关。当您为服务付费时,您不想滥用它,因此要遵循一些规则。免费代理完全是另一个故事。在大多数情况下,我不推荐免费代理。它们对于简单的网页浏览来说是可怕的,因为它们很可能会窃取你的数据。

它们将不适用于特定的购买计划,例如限量版Nike或Ticketmaster,因为这些网站已经禁止了它们。它们很慢,很快就会耗尽,需要经常更新。

尽管如此,您还是会使用它们。我明白,把钱扔在代理上可能行不通。如果您刚刚开始使用免费代理,或者至少尝试使用它们来理解过程是很容易的。一旦您开始转向有收入的代理人,那就是要走的路。

有一种非常好的免费代理应用程序:批量web抓取。如果您需要从大量的数据源中获取数据,并且不太关心准确性或100%的完成率,那么使用免费代理。

您可以从各种渠道获得的免费代理大量列表,像blackhatworld,然后得到ScrapeBox和运行检查,对所有的代理,看看哪些仍然有效。每天这样做,你将建立一个免费代理的集合,将工作一段时间。

使用工作代理,并与他们一起运行一些批量Web抓取工具。您可以将ping频率设置为合理的值,当涉及到免费代理时,就没有那么多需要担心的了。

它们最终会被禁止,不管是你自己使用还是别人使用。把这些参数尽可能地放高(只要你还能得到一定的回报率),然后看看会发生什么。

但是,请不要将线程数设置得太高,因为这会对您的ISP产生负面影响,并且您不希望他们知道您正在大量收获免费代理服务。


结论

希望这能让您清楚地知道需要多少代理。越多越好,但是有很多方法可以利用一小批付费代理。

对于像ScrapeBox和GSA这样的独立应用程序,经常有论坛和帮助中心提供更多的技术或具体参数的建议。拿到你的第一批,设定限度,看看会发生什么。