用户代理:概述、查找及使用 | 查看你的User Agent


找出您的用户代理正在揭示关于您的什么信息!查找关于用户代理字符串的详细信息,包括操作系统、浏览器版本等……


什么是我的用户代理?

您的浏览器用户代理是:

Mozilla / 5.0(Windows NT 10.0; WOW64)AppleWebKit / 537.36(KHTML,例如Gecko)Chrome / 87.0.4280.88 Safari / 537.36


您的用户代理字符串查找

查找您的Web浏览器的用户代理字符串详细信息以解析您的用户代理字符串,此处显示了您的操作系统,Web浏览器版本…

Your operating system does not meet the requirement!

Recommended operating systems:

  • Windows Vista
  • Windows 7
  • Windows 8
  • Windows 8.1
  • Windows 10
  • Mac OS X

Your web browser is not supported!

Please try using any of the following web browsers:

  • Internet Explorer 9+
  • Microsoft Edge
  • Firefox 27+
  • Chrome 33+
  • Opera 12+
  • Safari 6+

JavaScript is disabled! - Please enable JavaScript!

Cookies check failed! - JavaScript is required. Please enable JavaScript!

Java check failed! - JavaScript is required. Please enable JavaScript!

Adobe Flash Player check failed! - JavaScript is required. Please enable JavaScript!

相关的:您的真实公网IP地址是什么?

您可能会怀疑是否是您的用户代理字符串?该浏览器(UserAgent)信息是否属于我?好的,我想告诉您如何自行找到浏览器用户代理,


如何检查用户代理?

  • Check user agent in chrome

在地址栏中输入“ chrome:// version ”。

用户代理:概述、查找及使用 | 查看你的User Agent

  • 在Firefox中检查用户代理

在地址栏中输入“ about:support ”。

用户代理:概述、查找及使用 | 查看你的User Agent

  • 在Microsoft Edge中检查用户代理

在地址栏中输入“ edge:// version


用户代理101:浏览器UA字符串的终极指南

您是否想了解Web网络中用户代理的概念?编写此页面旨在教育您有关这一概念的信息。在此页面上,您将学习用户代理的含义,用途,与使用相关的问题以及更多其他信息。

用户代理:概述、查找及使用 | 查看你的User Agent

作为使用Web浏览器的Internet用户,Internet的整个模型是抽象的,易于使用。您的Web浏览器在幕后发生了很多事情,可以帮助您完成一些任务。

您可能会想知道,当您向Internet上的服务器发送Web请求时,浏览器会自我识别并提供Web服务器需要更好响应的其他技术信息。如果没有浏览器标识自己,Web服务器将仅返回通用响应,根据使用的Web浏览器,该响应可能无法很好地呈现。

不,用户代理的概念不仅与Web浏览器相关。我使用Web浏览器是因为它们是Internet用户最常用的浏览器。用户代理程序包括爬网程序,Web爬虫程序,可访问Internet的游戏机,甚至智能电视或某些IoT设备。完整阅读本文之后,您将具有有关用户代理的足够知识。


什么是用户代理?

用户代理是代表Internet用户与Web服务器交互的任何软件。它们也可以看作是您和Internet之间的桥梁。

将Web请求发送到Web服务器的任何软件都是用户代理,无论其是否独立于人机交互而工作,例如在自动化工具或机器人的情况下,还是在Web浏览器和接受人的直接命令的其他软件的情况下。

例如,如果您想在线发送访问内容,则必须使用充当用户代理的Web浏览器,该代理处理检索,渲染并使其与内容进行交互。

在网络协议中,客户端被视为用户代理,用于与客户端-服务器网络系统进行通信。您可能会想知道电子​​邮件阅读器是邮件用户代理。

用户代理不止于此-游戏机可以是用户代理,您的智能电视和其他支持Internet的设备也可以是用户代理。在超文本传输​​协议(HTTP)中,使用用户代理标头标识客户端(用户代理)。

  • 什么是HTTP标头以及如何检查HTTP标头?

用户代理识别

用户代理:概述、查找及使用 | 查看你的User Agent

如前所述,客户端软件向网络服务器发送网络请求时,会在其请求旁边发送其身份,并提供有关其自身的Internet服务器信息,包括但不限于其名称,应用程序类型,操作系统,软件版本,软件供应商,渲染引擎以及提供的其他信息。

对于网络爬虫,网络爬虫和其他自动化机器人,它们的惯例是在URL或可用于联系其操作员的任何其他详细联系信息中包括“机器人”一词。所有这些详细信息都放在一个称为用户代理字符串的字符串中。用户代理字符串捆绑在HTTP Web请求中的用户代理标头中。

例如,在Windows操作系统上运行的标准Google Chrome浏览器将发送以下字符串作为其用户代理字符串。

Mozilla / 5.0(Windows NT 10.0; Win64; x64)AppleWebKit / 537.36(KHTML,如Gecko)Chrome / 87.0.4280.88 Safari / 537.36

在iPhone上,Chrome在下面的字符串中标识自己。

Mozilla / 5.0(iPhone; CPU iPhone OS 14_2,例如Mac OS X)AppleWebKit / 605.1.15(KHTML,例如Gecko)CriOS / 87.0.4280.77 Mobile / 15E148 Safari / 604.1

其他所有浏览器,Web bot和其他客户端应用程序都有其自己的字符串,可用于标识自己。查看上面的字符串,您可以看到它带有浏览器的名称,其操作系统和平台以及版本等。

您需要注意的一件事是,尽管命名有一个标准,但没有强迫遵循该标准,因此,某些用户代理字符串可以仅具有应用程序名称,也可以使用任意名称或假名称。一些机器人开发人员甚至在其他人中使用流行浏览器的用户代理来隐藏其活动。

Bad Bot 101:如何检测和阻止坏机器人?

用户代理的使用

Uses-of-User-Agents-1024x682

您可能想知道为什么客户端软件会自我识别,并且Web服务器需要该信息做什么?事实证明,用户代理有两个主要用途。其中包括内容协商和访问授权以及阻止。

  • 内容协商

根据设备的功能向设备提供的网页有很多变体。以Google搜索引擎结果页的结构为例,具体取决于您用于访问它的浏览器或平台。通过查看用户代理字符串,Google可以为您的浏览器和设备提供最佳版本。

Internet上还有许多其他站点都使用用户代理来提供更好的用户体验。如果没有用户代理,充其量只能为您提供页面的通用版本,该页面在浏览器上的呈现效果可能不佳。Bot开发人员使用此方法通过使用移动浏览器代理来避开JavaScript丰富的网站,该代理将使Web服务器返回页面的非JavaScript重型版本。

  • 访问协商和阻止

也许,用户代理字符串的最流行用法是了解特定的客户端软件是否具有访问某些内容的访问权。Web服务器使用HTTP请求标头中的用户代理字符串将爬网程序,爬虫和其他漫游器排除在其平台之外。

互联网上许多受欢迎的网站都对僵尸网络流量感到厌烦,因此,它们将拒绝访问除流行浏览器以外的用户代理。当他们在内部执行此操作时,他们可以通过robots.txt文件提供网络抓取工具信号-并希望您遵循其中的指令。通常,Web服务器只希望允许访问来自用户的流量,并倾向于阻止来自自动化源的流量,除非这样做有好处。


Robots.txt文件和用户代理

机器人排除标准(也称为robots.txt文件)是网络服务使用的通信标准,用于将特定指令传递给自动化机器人,例如爬网程序和刮板。该标准通知Web bot是否允许访问其页面上的内容。有些网站甚至没有robots.txt文件。其他人已经使用它并提供了广泛的指令。

使用robots.txt,您可以将指令指定给特定的漫游器或所有漫游器。robots.txt文件中存在的某些指令包括授予和拒绝所有bot或特定bot的访问权限,提供有关爬网速度的指令以及某些您不希望bot访问的页面的指令。

用户代理:概述、查找及使用 | 查看你的User Agent

除了并非所有Web服务都允许Web抓取自动化访问这一事实外,有些服务还降低了基础架构,因此提供了有关如何以自动化方式访问其站点的指令,以避免对服务器性能产生不利影响。关于robots.txt文件的一件不幸的事是,bot开发人员和操作人员不尊重它们。

公平地说,网络爬虫和其他漫游器都应解析robots.txt文件,以确定是否允许其用户代理访问。但是,大多数漫游器开发人员和操作员完全忽略了robots.txt文件。更糟糕的是易于操作用户代理字符串标头的值。


最常见的用户代理字符串

在本文的这一部分中,我们将列出最受欢迎的用户代理的用户代理字符串。正如您将在本文后面发现的那样,您可以使用将您的软件用户代理更改为另一个软件用户代理的代理,然后获取访问的Web服务,将其视为您用作其用户代理的软件。


前1000名代理用户<更新5分钟前><Updated 5 Minutes Ago>


Top 1000 User Agents <Updated 5 Minutes Ago>

对于最受欢迎的用户代理,我们将研究3类,浏览器,搜索搜寻器等。

流行的浏览器用户代理字符串

即使对于相同的浏览器,但在不同的操作系统上,字符串也有所不同,因此,浏览器的用户代理字符串数量也很多。因此,我们只关注少数几个。


  • 标准Chrome用户代理
Mozilla/5.0 (Macintosh; Intel Mac OS X 11_0_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36
  • Android Chrome用户代理
Mozilla/5.0 (Linux; Android 10) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.86 Mobile Safari/537.36
  • iPhone Chrome用户代理
Mozilla/5.0 (iPhone; CPU iPhone OS 14_2 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) CriOS/87.0.4280.77 Mobile/15E148 Safari/604.1

  • Firefox Windows用户代理
Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0
  • Android Firefox用户代理
Mozilla/5.0 (Android 11; Mobile; rv:68.0) Gecko/68.0 Firefox/83.0
  • iPhone Firefox用户代理
Mozilla/5.0 (iPhone; CPU iPhone OS 11_0_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) FxiOS/29.0 Mobile/15E148 Safari/605.1.15

  • 标准Safari用户代理
Mozilla/5.0 (Macintosh; Intel Mac OS X 11_0_1) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0.1 Safari/605.1.15
  • iOS Safari用户代理
Mozilla/5.0 (iPhone; CPU iPhone OS 14_2 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Mobile/15E148 Safari/604.1

Standard Edge用户代理

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36 Edg/87.0.664.55

Android Edge用户代理

Mozilla/5.0 (Linux; Android 10; HD1913) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.86 Mobile Safari/537.36 EdgA/45.11.2.5102

iOS Edge用户代理

Mozilla/5.0 (iPhone; CPU iPhone OS 14_2 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 EdgiOS/45.11.1 Mobile/15E148 Safari/605.1.15

就像浏览器一样,每个搜索引擎都有大量的搜寻器,因此,存在许多用于搜寻器的用户代理字符串。让每个搜索引擎输入零。

  • Google User-Agent:

Googlebot / 2.1(+ http://www.googlebot.com/bot.html)

  • Bing用户代理:
Mozilla/5.0 (compatible; bingbot/2.0 +http://www.bing.com/bingbot.htm)
  • 百度用户代理
Baiduspider +(+ http://www.baidu.com/search/spider.htm)
  • 雅虎用户代理

Mozilla / 5.0(兼容; Yahoo!Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

  • DuckDuckGo用户代理:
DuckDuckBot / 1.0; (+ http://duckduckgo.com/duckduckbot.html)
  • Yandex用户代理
Mozilla / 5.0(兼容; YandexBot / 3.0; + http://yandex.com/bots)

除了用于浏览器和搜索引擎的用户代理,还有很多其他流行的用户代理。让我们看看其中的一些。

  • Alexa用户代理
ia_archiver(+ http://www.alexa.com/site/help/webmasters; [email protected] )
  • Facebook外部热门用户代理
facebookexternalhit / 1.0(+ http://www.facebook.com/externalhit_uatext.php)
  • Google AdSense用户代理
Mediapartners-Google

下载用户代理列表

我们曾经运行过一个需要大量用户代理字符串数据的Andriod抓取项目,我想在这里分享它。请注意,所有这些用户代理均来自Andriod设备,我已按移动品牌,浏览器,国家/地区和版本对其进行了排序。

  • 下载用户代理列表
  • 按品牌模型划分的用户代理
  • 浏览器用户代理
  • 用户代理(按国家)
  • 用户代理(按版本)

用户代理欺骗

用户代理字符串仅由客户端应用程序的开发人员设置。尽管Web浏览器,有益的爬网程序和其他良好的客户端遵循命名约定,但Bot开发人员并未遵循该约定。实际上,对于僵尸程序开发人员或操作员来说,使用流行的Web浏览器的用户代理字符串以使其不被人们注意并逃避反僵尸系统是一种常见的做法。

使用任意用户代理字符串(例如使用像Chrome这样的流行浏览器之一)的过程称为用户代理欺骗。您可以轻松使用。

  • 用户代理切换器

用户代理:概述、查找及使用 | 查看你的User Agent

  • Extensions User-Agent Switcher for Chrome
  • Extension for 🦊 Firefox
  • 如何手动欺骗用户代理?

不过,您可以通过Chrome中的开发者工具更改用户代理,而无需任何扩展程序,这是方法:

大多数机器人开发人员将使用Chrome或Googlebot的用户代理。

用户代理欺骗是不道德的,因为它不能为Web管理员提供任何联系您时需要与您联系的跟踪信息。

但是,由于大多数Web服务都不允许漫游器访问其服务,因此漫游器开发人员已经养成了欺骗用户代理的习惯。当与好的机器人打交道时,可以很有效,但是如果是不好的机器人,则可以使用伪造的用户代理字符串来确保它们不会留下任何痕迹。


有关:

  • 如何欺骗和伪造您的IP地址
  • IP地址告诉您什么?

用户代理字符串的问题

用户代理可被客户端修改的事实使它们不可靠。Web管理员不能依靠它们来保护其服务器免受机器人流量的攻击。Bot开发人员可以将它们与其他技术一起使用来欺骗Web服务器。

但是,不,这不仅仅是停止用户代理字符串问题的地方。另一个主要问题是在隐私方面,因为已发现用户代理字符串有些“可指纹”。对于那些对此知之甚少的人,有一些Web服务可以根据用户的浏览器信息对其进行跟踪。这称为浏览器指纹识别,用户代理字符串是组件之一。

用户代理:概述、查找及使用 | 查看你的User Agent

随着越来越多的人开始意识到在线隐私,有必要放弃其使用或降低其可指纹性。有趣的是,浏览器供应商正在开发一个新系统,该系统将提供一种无需“可指纹”功能的客户端识别方法。

  • 如何防止浏览器指纹

用户代理字符串的未来

网络正在走向用户代理字符串将成为历史记录的时代。换句话说,由于正在积极开发某些技术来代替它们,因此用户代理字符串在未来将不再占有一席之地。它们被称为混乱,不可靠并且是指纹的来源,因此必须有更好的选择。

Google大力支持Client Hint的开发,该技术将取代用户代理字符串。Google正在采取措施逐步淘汰Chrome浏览器中的用户代理字符串,其他网络浏览器供应商对此也表现出了兴趣。

目前,Google统一了Chrome浏览器的用户代理字符串,因此您从用户代理字符串中所获得的就是它是在台式机或移动设备上运行的Chrome浏览器。

用户代理:概述、查找及使用 | 查看你的User Agent

从上面可以看到,用户代理字符串的将来是Client Hint。Client Hint要做的是,它查询Web浏览器以返回有关其自身的某些信息,而不会透露太多可用于跟踪的信息。使用提供的信息,Web服务器可以使用提示进行内容协商,这是用户代理字符串的主要用途。

结论

毫无疑问,用户代理字符串在内容协商和用于访问权限确定的客户端应用程序标识领域中占有一席之地。但是,它们被称为凌乱的,被称为“可指纹的”细节,有助于通过窗口排除隐私。

因此,正在搜索更好的替代方法,因为“客户提示”可能是候选对象。目前,它仍在使用中,您需要在方案中考虑它。


  • 抓Google时防止禁令和验证码的代理
  • 5种检测IP地址是否是代理的方法
  • 为什么您的代理被搜索引擎阻止
  • 如何在不被阻止的情况下抓取网站!