整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

网站是如何采集设备指纹的?如何完美隐藏您的设备指纹?

网站是如何采集设备指纹的?如何完美隐藏您的设备指纹?

备指纹是一种用于识别和追踪设备的技术。它通过收集设备的独特特征和属性,如操作系统版本、浏览器类型、屏幕分辨率、语言设置、硬件配置等,生成一个唯一的设备标识符。


设备指纹技术可以用于多种用途,其中一个常见的应用是在网络安全和反欺诈领域。通过对设备指纹进行分析和比对,可以识别出恶意行为、欺诈活动和重复注册等问题,并采取相应的措施,如封禁账户、限制访问等。


设备指纹的收集可以通过多种方式进行,以下是一些常见的收集方法:


1. 浏览器指纹:网站可以通过JavaScript代码获取浏览器的各种属性和配置信息,如User-Agent字符串、浏览器类型、操作系统、插件、字体、时区等。


2. IP地址:每个设备在互联网上都有一个唯一的IP地址,可以使用IP地址来判断设备的地理位置和网络提供商等信息。


3. 设备属性:通过检测设备的硬件属性,如屏幕分辨率、设备型号、操作系统版本、语言设置、时区等,可以生成设备的指纹。


4. Cookie和本地存储:网站可以使用Cookie和本地存储来存储一些设备标识符,以便在后续访问中进行识别和匹配。


5. HTTP头信息:通过分析设备发送的HTTP请求头信息,可以获取一些设备属性和特征,如Referer、Accept-Language、Accept-Encoding等。


6. 加速器和代理服务器:某些代理服务器和加速器会在请求中添加特定的HTTP头信息,这些信息可以用于设备指纹的分析和识别。


需要注意的是,设备指纹的收集通常是无感知的,用户在访问网站时并不需要主动提供任何信息。同时,合法的数据收集应该遵循隐私保护原则,如遵循相关隐私政策、匿名化处理和数据安全等。


如果您要掩盖设备指纹,以下几种方法可能会对你有帮助:


1. 使用匿名浏览器或隐私模式:匿名浏览器或隐私模式可以更好地保护你的隐私,因为它们通常会限制网站对浏览器属性和配置的访问。


2. 禁用或限制浏览器插件:一些浏览器插件可能会提供额外的信息给网站,禁用或限制插件可以降低设备指纹的唯一性。


3. 使用代理服务器或虚拟指纹浏览器:代理服务器或指纹浏览器可隐藏你的真实IP地址和网络提供商信息,并改变你的虚拟位置,从而增加设备指纹的混淆度。


4. 定期清除Cookies和本地存储:清除浏览器的Cookies和本地存储可以减少网站对你的设备进行跟踪和识别的可能性。


5. 定期更换用户代理字符串(User-Agent):用户代理字符串是浏览器发送给服务器的一部分信息,定期更换用户代理字符串可以增加设备指纹的多样性。


6. 使用隐私增强浏览器扩展:一些浏览器扩展可以帮助你降低设备指纹的唯一性,如随机化用户代理、禁用指纹收集脚本等。


MuLogin防关联浏览器可以创建多个唯一指纹浏览器,每个浏览器指纹环境、cookies、本地存储和其他缓存文件将被完全隔离,浏览器配置文件之间无法相互泄漏信息,以达到多账号安全登录不被关联。


任何具有重复性的工作都可以在MuLogin中通过自动化完成。而且您可以通过一系列Local API或者Selenium、Puppeteer等工具库来实现MuLogin的自动化功能。


在MuLogin防关联浏览器中,主账号可以管理多个子账户,每个子账户都是独立操作。用户可以通过分享或转移配置文件功能轻松掌控团队成员接触浏览器配置文件的权限。您可以让第一位管理员创建账户,然后轻松地将这些浏览器配置文件分享给员工,或转移给您的客户使用,数据实时同步云端,所有的操作可以在同一个环境中完成,避免了任何风险和麻烦,有效提升工作效率!

络上的爬虫日益猖獗,疯狂地采集网站上的内容,不仅没有带来一丝好处,反而导致内容的流失、增大服务器的压力。

在众多的访问者中识别出网络爬虫并限制其访问一直是各个网站运营者所关心和头疼的事情。

州的先生一直以来持有的观点就是,网络爬虫的反爬与反反爬,会像网络安全的黑客攻防一样,在你强化一步,我突破一步的节奏中不断升级和完善。 没有哪一个反爬手段是一劳永逸的,也没有哪一个反反爬技术可以一招鲜吃遍天。

如果有,可能就是网站招安了爬虫,爬虫收购了网站。

在现行的网络爬虫检测技术中,主要有以下两大类:

  • 行为检测
  • 指纹识别

行为检测是通过分析网页上用户的操作(鼠标的移动、点击、滚动行为和浏览行为)来判断操作者是否是机器控制的网络爬虫。

而指纹识别则是通过分析设备和浏览器的信息来判断访问者是否为网络爬虫。

行为检测要是深入展开来谈可以说上几天几夜,在此不表。

本文,主要介绍指纹识别的检测。

每一台电脑、每一个操作系统、每一个浏览器,都有属于它自己的设备信息。比如电脑的CPU数量、显卡型号、操作系统的位数、浏览器的版本等。

将这些设备信息加以组合,就可以作为请求者的指纹来进行识别。比如,一个Windows的浏览器,显示的却是Linux的操作系统,没问题就有鬼了。

再比如,用 Python 的小伙伴很喜欢使用的 Selenium,其会在浏览器中带上 webdriver 的标记,而这个标记,是正常的浏览器所没有的。

在 Github 上,有大神开源了一套浏览器指纹收集和识别的项目—— fp-collectfpscanner

通过 fp-collect ,我们可以收集获取到当前访问者的浏览器指纹;通过 fpscanner ,我们可以判断浏览器的某一项指纹是否可疑。

fp-collect 是一个 JavaScript 文件,放置在网页中加载,当访问者访问网页时,就可以获取到浏览器的指纹信息。

在此举一小例来演示:

例如,我们创建一个如下所示的HTML页面:

<html>
    <script src="./fpCollect.min.js"></script>
    <script>
        fpCollect.generateFingerprint().then((fingerprint)=> {
            console.log(fingerprint)
        });
    </script>
</html>

当我们访问这个网页时,在控制台就可以看到我们的浏览器指纹。

下面我们分别用正常的浏览器和 Selenium 驱动的 Chrome 访问上述HTML页面:

from selenium import webdriver

driver=webdriver.Chrome(executable_path=r"E:\driver\chromedriver.exe")

driver.get("file:///F:/fp-collect/fp-collect.html")

最终对比两个浏览器的控制台输出的值,可以清晰地看到,Selenium 驱动的 Chrome 浏览器被识别出使用了 webdriver:

在此我们还没有使用 fpscanner 对浏览器的其他指纹进行识别。

fpscanner 会对传入的浏览器指纹项进行识别和判断,最终给出三个结果:

  • 一致:表示为检测到任何可疑;
  • 不确定:表示检测的指纹可以是爬虫,也有可能不是爬虫;
  • 不一致:表示检测的指纹是爬虫;

fpscanner 的使用在此就不做演示,有兴趣的小伙伴可以自行试验一下。

如同文章开头所说的,爬虫攻防是一个持续性相互较量的过程,爬虫当然不会白白的把自己的真实指纹暴露出来。

在 Selenium 中 通过 execute_cdp_cmd() 方法,也能够将 webdriver 标记去除掉。

虽然指纹识别有被攻破和绕过的可能,但是指纹识别相较于行为检测,可以比较快速地对访问者做出识别和判断,将那些看了几篇教程就撸起袖子一通乱干的爬虫死死地摁在地上。

就像一场战役的胜利,不仅仅是某一兵种的付出一样。网站的爬虫防御,也需要各个环节的配合和努力。指纹识别类似于静态检测,而行为识别则是动态检测,动静结合,方是长久。

当然,最长久之计还是: 网站招安了爬虫,爬虫收购了网站。


作者:州的先生

出处:https://zmister.com/archives/1604.html

站指纹识别技术被广泛应用于跟踪和识别用户。通过收集和分析用户设备的各种唯一特征,网站可以创建用户的“指纹”,用于识别和追踪用户的在线活动。对于普通用户来说并无大碍,但是对于海外营销、跨境电商等业务来说至关重要。那么常见检测信息有哪些、该如何隐藏呢?

一、网站指纹识别的信息:

网站指纹识别是一种通过收集和分析浏览器和设备特征来唯一标识用户的技术。这些特征包括但不限于:

1.浏览器信息:操作系统、浏览器、浏览器版本、Header、JavaScript、PDF Viewer、Chromium PDF Viewer、WebKit built-in PDF等。

2. IP 地址:IP、WebRTC、网络运营提供商等。

3. 地理位置:具体的国家-洲省-城市,以及经纬度。

3. 软件信息:基于IP的时区(时间)、本地时区(时间)、语言、请求头语言、字体、字体列表、Javascript、Flash插件、Cookie等。

4. 硬件信息:Canvas、WebGL、WebGL Report、渲染、Audio、Client Rects、WebGPU Report、屏幕分辨率、颜色深度、可用屏幕尺寸、设备内存、媒体设备等。

通过收集这些信息并结合算法进行分析,网站可以生成用户的唯一指纹,用于识别和追踪用户的行为。

二、如何隐藏或伪装浏览器指纹信息?

1. 使用隐私浏览模式:隐私浏览模式可以限制网站对用户数据的追踪,每次关闭浏览器后会自动清除浏览记录和Cookie信息。

2. 阻止指纹识别脚本:*使用浏览器插件如Privacy Badger或uBlock Origin来阻止网站的指纹识别脚本。

3. 定期清除Cookie和浏览器缓存: 定期清除浏览器的Cookie和缓存数据,可以减少网站对您的追踪。

4. 使用代理服务器结合指纹浏览器: 使用代理服务器+指纹浏览器,可以隐藏用户的真实IP地址和真实的浏览器指纹,增加匿名性。

MuLogin指纹浏览器内,可以创建多个独立的指纹浏览器。每个指纹浏览器都可自定义修改指纹参数和IP地址,包含以上所有网站会检测的指纹参数。这样每个帐号都有独一无二的指纹,并能实现浏览器环境隔离。

如果你需要提高互联网的匿名性,或者需要在同一台电脑上同时登录并管理多个跨境电商平台/社交媒体/广告营销等账号,MuLogin可为您提供最大的便利。

三、结语

了解网站指纹识别的原理和常见检测信息,并采取相应的隐私保护措施,可以帮助用户减少被网站追踪和识别的可能性,保证业务顺利开展。