如果说 Cloudflare 是每个人最先遇到的反爬系统,那 DataDome 和 PerimeterX(现已并入 HUMAN Security)就是终结一个个采集项目的那两个。它们守护的是人们真正想要的目标:球鞋和票务站点、旅行机票引擎、大型电商平台、分类信息站。而且和 Cloudflare 的免费档不同,每一个上了它们的网站都是专门花了钱来拦你的。
本文讲的是 2026 年这两套系统各自检查什么、为什么 GitHub 上那些「bypass」仓库都已经死了,以及那套仍然有效的四层打法。它沿用了我们 Cloudflare 绕过指南 的结构——如果你还没读,先从那篇开始,基础部分是重叠的。
例行声明:采集公开数据,遵守服务条款和当地法律,别把这里的任何内容用在你无权访问的系统上。
DataDome 跑的是一个服务端决策引擎,由三组信号喂养,每个请求在 2ms 内完成打分:
navigator 属性,以及 CDP/headless 痕迹。这份载荷是加密且防重放的——抓到一份有效载荷再重发,这招很多年前就失效了。分数不过关,你就会拿到「captcha-delivery.com」插页(DataDome 验证码),或者一个带 datadome cookie 的静默 403。
同样三大支柱,权重不同。PerimeterX 更倚重它的 JavaScript 传感器(_px cookie、px.js 采集器)和行为生物特征。它的「Human Challenge」——那个按住不放的按钮——是专门设计来要求真实指针压力曲线的,重放机器人过不了。
对你有实际影响的差异:
px-bypass 仓库都在几周内死掉。在这些目标上没有商量余地。用一个滥用历史低的池子里的住宅或移动 IP,按会话轮换,而不是按请求轮换:
# 每个浏览身份一个 sticky 会话——看起来像一个真实用户的一次访问
proxy = "socks5h://USERNAME-session-a1b2c3:[email protected]:913"
对 DataDome 做按请求轮换适得其反:一个每次页面加载都换 IP 的「用户」,本身就是机器人特征。一个逻辑访问(5–15 页)保持一个 IP,然后就退役这个 session ID。如果你吃了 403 或验证码,不要在同一个 IP 上重试——那个 IP 现在更热了;换 session 并放慢速度。
对于 DataDome/PerimeterX 守护的流程,跑一个真实的 Chromium——条件允许就用 headed——通过 Playwright 配上 anti-CDP-detection 补丁(rebrowser-patches 及其分支),或者用一个商业防关联浏览器。JS 传感器必须执行,并产出一个自洽的设备故事:真实的 canvas 熵、一致的屏幕参数、与代理 IP 所在国家匹配的时区。
真正能击败这些系统的算法是:与其让一个身份去跑 1000 页(不可能伪装成人类),不如让 100 个身份各跑 10 页。每个身份 = 一个住宅 session ID + 一个指纹 + 人类节奏。这是一场经济学的较量——你靠把每个身份都做得平平无奇、毫不起眼来取胜。
| 方面 | DataDome | PerimeterX / HUMAN |
|---|---|---|
| 坏 IP 的处理 | 即时 403 / 验证码插页 | 常为软处理:降级或投毒响应 |
| 挑战类型 | 拼图验证码(captcha-delivery.com) | 按住不放的 Human Challenge |
| 检测侧重 | 网络层 + 设备 | JS 传感器 + 行为生物特征 |
| 要盯的 cookie | datadome | _px2 / _px3 |
| 被挑战时 | 换 session,不要在一个 IP 上反复解题 | 狠狠退避;反复挑战失败会污染该身份 |
两套系统都能静默地坑你。给你的流水线装上仪表:
2026 年的 DataDome 和 PerimeterX 是打分系统,不是闸门——你不是靠某一个小技巧去「bypass」它们,而是在每一层上同时把自己压在分数阈值之下:每个身份一个干净的住宅 IP、一个打过破绽补丁的真实浏览器、人类行为,以及横向规模。成功的团队把每个身份都当作一次性、不起眼的;失败的团队则试图让一个连接去干超人的活。
新用户注册即送500M免费流量,首次充值额外加赠,活动期间限时开放。