camofox-browser:给 AI Agent 用的浏览器,少在页面上打补丁

用 Agent 跑网页任务,最烦的地方,很多时候不是按钮点不到。

是页面刚开。

站点先把你当机器人拦住了。

User-Agent 改一遍。
WebGL 改一遍。
Canvas 再补一下。

最后指纹检测还是给你打回来。

我以前最烦这种问题。不是难,是碎。你以为改完了,换个站,又来一套。

最近看到一个项目,叫 camofox-browser

它的思路不是在网页里塞一堆 JavaScript 补丁,临时把浏览器指纹糊过去。

它是从浏览器底层做伪装。

项目基于 Camoufox,又在外面封了一层,目标很明确:给 AI Agent 当浏览器用。

这个方向我会多看两眼。

因为很多 Agent 拿网页的时候,拿到的其实不是“页面”。

是一大坨 HTML、CSS、脚本、DOM。

模型读起来费 token,人看日志也烦。你只是想让它点个搜索框,它先吞半页无关结构。

camofox-browser 返回的是精简过的无障碍快照。

官方说,比原始网页小大概 90%。

页面还在。
按钮还在。
输入框、链接这些能交互的东西还在。

乱七八糟的噪音少很多。

对 Agent 来说,这比整页 DOM 直接塞进去舒服一点。截图也不是不能用,但截图又绕到视觉模型那边去了,成本和稳定性都要重新算。

项目里还放了十多个搜索宏。

Google、YouTube、Amazon、Reddit 这些站点,不用每次都自己写跳转、输入、等待、解析。

直接调。

这个功能不大,但我挺喜欢这种小东西。真接工作流的时候,少写一段胶水代码就是少一个坑。

登录态也没完全丢给你自己处理。

它可以导入浏览器 Cookie。
用户会话独立隔离。
代理能配。
地理位置也能跟着匹配。

这些东西写在介绍里看着很普通,真做多用户 Agent 的时候,就知道麻烦在哪了。

一个用户一个登录态。
一个地区一套代理。
别串。别乱。别一跑任务全掉线。

还有个小点,适合穷跑法。

闲置内存大概 40MB。

树莓派,5 美元小机器,都能跑一跑。不一定一上来就搞一套很重的浏览器集群。

当然,别把它当“装上就过所有风控”。

网站检测一直在变,这块没有什么永久答案。

我更在意的是它没继续往页面层堆补丁,而是直接把浏览器本身伪装得更像正常用户环境。

Agent 要深度跑网页,登录、搜索、解析、指纹检测,这几个坑迟早会碰到。

camofox-browser 算是把其中几个坑放到一个浏览器层里处理了。

GitHub地址: https://github.com/jo-inc/camofox-browser

返回分类列表