Browser-Use 与 Computer-Use AI Agent 的代理配置指南(2026)

发布于 2026年6月4日 · 阅读约 11 分钟

2026 年是 AI agent 不再只是 demo 的一年。browser-use、OpenAI 的 Operator 式 agent、Anthropic 的 computer use,以及十几个基于 Playwright 搭起来的框架,如今都在驱动真实浏览器去访问真实网站——订票、下单、调研、监控。而它们全都撞上同一堵墙:它们操作的那些网站把它们当作机器人,因为它们就是机器人

这篇指南专门讲驱动浏览器的 AI agent 的代理层。如果你的 agent 用的是 HTTP 库而不是浏览器(LangChain 工具、CrewAI 里的爬虫),请看 AI Agent 代理实战:LangChain、AutoGPT 与 CrewAI——本文讲的是控制完整浏览器的 agent。

为什么浏览器 Agent 比爬虫更快被封

反直觉但确实如此:一个驱动真实 Chrome 浏览器的 LLM agent,往往比一个朴素的 Python 爬虫被封得更快。三个原因:

  1. 数据中心 IP + 完美浏览器 = 自相矛盾。浏览器指纹说「真实硬件上的真实 Chrome」,但 IP 属于 AWS 或 GCP——大多数 agent 都跑在那里。反爬厂商给 IP 的 ASN 很高的权重;一个住宅级的指纹配上数据中心 ASN,是教科书级的自动化特征。
  2. Agent 像机器一样重试。当一个动作失败时,LLM 循环会立即从同一个 IP、以几乎相同的节奏重试。连续三次飞快的相同重试,是行为检测的入门课。
  3. CDP 会留下痕迹。大多数 agent 框架通过 Chrome DevTools Protocol 驱动浏览器。网站会探测 navigator.webdriver、CDP 特有的时序痕迹以及 headless 的破绽。再叠加一个被标记的 IP,分数瞬间就越过封禁阈值。

这三者里 IP 是最便宜的修复项,而且光修它就能解决大部分封禁:把 agent 的流量走住宅代理,让 IP 的故事和浏览器的故事对得上。

配置:browser-use 配住宅代理

browser-use 跑在 Playwright 之上,所以原生支持代理。模式是:每个 agent 任务一个 sticky 会话,让 IP 在 agent 干活期间保持稳定,下一个任务再换一个新 IP。

from browser_use import Agent, Browser, BrowserConfig
from langchain_openai import ChatOpenAI
import uuid

task_id = uuid.uuid4().hex[:8]

browser = Browser(config=BrowserConfig(
    proxy={
        "server": "http://us.jibaoproxy.com:913",
        "username": f"USERNAME-session-{task_id}",   # sticky:本任务内保持同一个 IP
        "password": "PASSWORD",
    },
))

agent = Agent(
    task="Find the current price of the Sony WH-1000XM6 on the three largest US retailers.",
    llm=ChatOpenAI(model="gpt-4o"),
    browser=browser,
)
result = await agent.run()

关键细节是那个 session-{task_id} 后缀。没有它,轮换网关可能在任务中途给 agent 换一个新 IP——购物车清空、登录掉线,agent 白白浪费 LLM 调用去重做步骤。有了它,整个任务从头到尾跑在一个 IP 上,下一个任务再拿一个干净的。

配置:原生 Playwright / Computer-Use 循环

如果你是在 Playwright 上自建的 agent 循环(大多数 Operator 式和 computer-use 实现背后的模式),代理就配在浏览器 context 上:

from playwright.async_api import async_playwright

async with async_playwright() as p:
    browser = await p.chromium.launch(headless=False)
    context = await browser.new_context(
        proxy={
            "server": "http://us.jibaoproxy.com:913",
            "username": "USERNAME-session-agent42",
            "password": "PASSWORD",
        },
        viewport={"width": 1366, "height": 768},
        locale="en-US",
        timezone_id="America/Chicago",   # 与代理所在国家匹配
    )
    page = await context.new_page()
    # ... agent 循环:截图 -> LLM -> 动作 -> 重复

localetimezone_id 设成与代理所在国家匹配。一个从美国 IP 浏览、却带着 UTC+8 时钟的 agent,是行为系统会给你扣分的不一致。

按 context 配代理还能让你做到一个浏览器,多个 agent:每个 new_context() 都能带自己的 session 后缀,于是十个并发的 agent 任务可以跑在十个不同的住宅 IP 上,而不需要起十个 Chrome 进程。

Agent 工作负载的会话策略

Agent 工作负载会话策略原因
调研 / 比价(无需登录)Sticky,10 分钟,每任务换新会话任务内稳定,跨任务换新 IP
登录态账号操作Sticky 30 分钟,每次运行用同一个 session ID网站会标记两次登录之间跨国跳变的账号
结账 / 订购流程Sticky 30 分钟结账中途换 IP 会让会话失效并触发风控审核
大批量监控(数百页)轮换,不钉会话最大化 IP 多样性,没有状态需要保留

成本控制:Agent 很烧流量

住宅流量按 GB 计费,而浏览器 agent 会拉取完整页面——图片、字体、追踪脚本——这和 HTTP 爬虫不同。不加管理的话,一个 agent 任务能吃掉 20–50 MB。三个修复办法,按影响大小排序:

  1. 拦掉 LLM 不需要的重型资源:
    await context.route("**/*.{png,jpg,jpeg,webp,gif,woff,woff2,mp4}",
                        lambda route: route.abort())
    如果你的 agent 读截图,就在目标页保留图片,但仍然拦掉视频和字体。如果它读 DOM/无障碍树,那图片也一起拦——能砍掉 60–80% 的流量。
  2. 只路由该路由的东西。LLM API 调用(OpenAI/Anthropic)绝不能走住宅代理——那是纯粹浪费 GB 还增加延迟。代理浏览器 context,而不是宿主进程。
  3. 在框架层面限制重试。最多两次重试,带退避,第二次换一个新 session ID——一个新 IP 解决的封禁,比第三次相同的尝试要多。

开启图片拦截和按需路由后,典型的浏览器 agent 任务能落在 2–8 MB 区间——按 $2/GB 算,每一百个任务也就几美分。

免费工具 · 无需注册

你的 Agent 浏览器能扛住反爬筛查吗?

把你的 agent(或你自己的浏览器)指向我们的 Anti-Bot Detector:它会就网站实际检查的那些信号给你打分——IP 类型、ASN、headless 破绽、指纹一致性——并告诉你是什么暴露了你。

运行反爬检测 →

如果它把你的 IP 标记为数据中心,那就是第一件该修的事——领取 500M免费流量 →

代理解决不了什么

实话实说环节。住宅 IP 能修复 ASN 不匹配和 IP 信誉问题,这是 2026 年反爬打分里最重的单一信号。但它修复不了:

把这三样都叠在一个住宅 IP 上,浏览器 agent 就能通过真实用户同样的检查。对于最硬的目标(DataDome、PerimeterX),见我们的 DataDome/PerimeterX 指南

小结

给你的 Agent 接上住宅 IP

500M免费流量——开着资源拦截,足够跑好几百个浏览器 agent 任务。

免费试用

所有IP产品通用 · 海量节点随时可用

现在加入,立享最高20%充值返现

新用户注册即送500M免费流量,首次充值额外加赠,活动期间限时开放。