99%的人以为“让 AI 上网查一下”就算做过调研了,其实你只看到了公开网页的皮毛。真正决定你要不要投钱、签合同、下订单的信息,往往锁在登录之后的后台、订阅内容和内部系统里。普通聊天机器人根本够不到这些地方,只能围着搜索结果打转。要想让 AI 真正替你干活,你得先把它“放进”自己的浏览器里,而且要在你完全授权和看得见的前提下。

Manus 的浏览器操作符(Browser Operator)就是干这件事的,但节奏由你掌控。只有当你明确打开 My Browser 连接器并授权,它才会在你本地的 Chrome 或 Edge 会话中工作,看你所看、进你能进的页面。这个小小的变化——在你自己的浏览器环境里执行任务——直接解锁了一整类过去根本做不到的深度调研和自动化。

浏览器操作符为什么能“查得更深”

订阅、内网、登录墙后的信息都能用上

很多高价值信息,其实已经被你“买”过一次:付费订阅、SaaS 账号、企业内部系统、政府或行业门户。云端 AI 看不到这些登录后的页面,只能停在公开介绍和免费预览上打转。有数据显示,知识工作者每天平均要在 10 个以上的系统之间来回切换,光是找信息就要花掉近 30% 的时间,这些时间几乎都浪费在“登进去再翻”的重复动作上。

授权浏览器操作符之后,它会在你本地浏览器环境里执行每一个任务,相当于一个“看得见页面”的助手,直接在你已经登录的站点上操作。你能访问的,它也能帮你访问;你没权限的,它也不会越界。信息来源一下子从“公开网页”扩展到“你已经付费和接入的一切资源”。

有用户反馈,把订阅内容、内部系统和公开网页一起纳入调研后,决策文档的修改次数减少了约一半,开会时争论也更聚焦在事实本身,而不是“谁去再查一下”。

典型对比:不用 Manus vs 用浏览器操作符

很多人感受到的差别,其实来自几个很具体的场景:

  • 阅读你已经付费的订阅内容
    不用 Manus:你在免费预览里来回翻,靠几段摘要猜作者到底想说什么。
    用浏览器操作符:Manus 利用你现有账号登录,直接阅读完整文章,把关键论点和数据提炼出来。
  • 差旅与预订
    不用 Manus:你在地图和 Booking.com 之间来回切换,手动对比价格、评分和距离。
    用浏览器操作符:Manus 按你的预算和筛选条件找酒店,再用地图核算步行时间,最后把候选结果整理成一目了然的列表。
  • 设备采购
    不用 Manus:你开几十个商品页,复制价格、看评论,生怕漏掉质量问题。
    用浏览器操作符:Manus 扫完所有产品页和评论,自动标出风险点,输出可直接用于决策的对比表。
  • 竞争对手招聘分析
    不用 Manus:你只能看到零散的公开招聘信息。
    用浏览器操作符:Manus 系统化地浏览职位信息,分类岗位类型,整理出招聘趋势表格。

这种能力还能延伸到专业自动化。通过 Manus API,你可以让浏览器操作符端到端驱动网页操作,尤其适合那些从没提供过公开 API 的老系统,比如老旧 HR 门户、财务系统或政府网站。说白了,就是给这些“没有接口的系统”强行接上了一双可用的手。

风险与边界:不是万能钥匙,也不是黑箱

浏览器操作符再强,也不是“万能钥匙”。它只能在你已经有权限的前提下工作,遇到多因素验证、硬件 UKey 之类的步骤,还是需要你亲自确认。有一位朋友试过让 Manus 帮他在银行网银里导出流水,结果卡在短信验证码那一步,只能自己补上,这种限制反而让人更安心。

从安全角度看,它的优势也很明确:操作发生在你本地浏览器里,敏感数据不需要额外上传到云端。你可以随时中断、随时接管,也能事后回溯每一步点击。自动化不是一团看不见的黑箱,而是一个你能盯着看、随时喊停的“半自动模式”。

带你走进“长尾网页”的迷宫

复杂政府/机构网站的“代点代找”

很多人被政府网站折磨过:菜单层级深、命名晦涩、入口经常变。比如要在 IRIS 这类税务门户里找一份特定报表,往往要点过三四级菜单、几个弹窗,稍不留神就走错路。我之前帮团队处理税务材料时,就在这种网站里绕了快半小时,心态直接崩掉。

现在可以把这种“迷宫式点击”交给 Manus。你只要说清楚目标,比如“帮我在 IRIS 里找到 2023 年度个人所得税申报回执 PDF 并下载”,它会在你的浏览器里一步步点过去,直到把文件找出来。你全程能看到它在哪个页面、点了哪个按钮,必要时还可以插一句“这一步先停一下,我确认下信息”。

这类场景的关键增量在于:AI 不再只给你一段“如何操作”的说明,而是直接在你的浏览器里,把这些步骤真实执行一遍。

表单、签证、申请流程:不再被细节拖垮

签证申请、学校报名、补贴申领,这些流程的难点往往不在“看不懂”,而在“太多细节容易漏”。你要找对表格版本、理解每一栏的含义,还得反复确认有没有上传错文件。有用户反馈,他在填写某国签证申请时,光是确认材料清单就花了两天。

浏览器操作符可以在这里扮演“流程陪跑员”的角色:

  • 帮你找到正确的表格模板和官方说明页;
  • 在浏览器里逐页走表单,标出需要你亲自填写或确认的字段;
  • 对一些容易出错的地方给出提示,比如“这里要求上传的是扫描件而不是照片”。

你不再只是拿到一份“操作指南”,而是有一个真的在页面里帮你点、帮你看、帮你检查的助手。说实话,这种陪跑感对减轻焦虑非常有用。

随处运行,随时接管

跨设备接力:工作电脑和个人设备无缝切换

浏览器操作符不是绑死在一台机器上的工具。你可以在公司电脑上启动一个任务,回家后在个人设备上接着看、接着改。要做到这一点,只需要在 Manus 设置里打开 My Browser 连接器,点击“配置”,再打开“允许跨浏览器任务”开关。

开关打开后,任何与你账号绑定、已授权的浏览器会话,都可以被 Manus 驱动。这在两种情况下特别有用:

  • 某个供应商门户只能在公司网络里登录,你在公司电脑上完成登录,让 Manus 在那台机器上跑调研;
  • 不想让大规模自动化任务占用主力工作机,就让 Manus 在一台备用电脑上跑,自己只看结果。

我也不太确定这个用法是不是最优解,但对很多安全要求高的团队来说,这种“分工”方式挺受欢迎。

手机发指令,桌面静默干活

你还可以在手机上触发浏览器操作符。通勤路上、排队等号时,打开 Manus 手机 App 发一个指令,比如“帮我整理下这周要采购的设备报价”,Manus 会在你授权的桌面浏览器上悄悄开一个会话,把任务跑完。

等你回到工位,桌面上已经躺着一份整理好的结果:对比表、候选清单、风险点标注都齐全。你只需要做最后的判断和拍板,而不是再去重复那些机械的点点点。对很多时间被会议切碎的管理者来说,这种“异步自动化”非常解压。

先授权你的浏览器

授权步骤:不到一分钟的准备

在让 Manus 替你“上网干活”之前,需要先给它一个合法的入口,也就是授权使用你的本地浏览器会话。整个过程很短,但决定了它能看到什么、能做到哪一步。

操作路径可以照着下面走:

  • 打开你的 Manus 工作区,进入 Connectors(连接器) 标签页;
  • 打开 “My Browser” 连接器,并为 Chrome 或 Edge 安装浏览器扩展;
  • 新建一个对话,在提示词里明确要求 Manus 使用你的浏览器;
  • 当 Manus 请求接管一个新标签页时,点击“Authorize(授权)”。

从这一刻起,它就能在你授权的标签页里执行任务,但每次关键操作前,你依然可以选择是否继续,这一点对安全感很重要。

安全与隐私:哪些是它“看不到”的

很多人会担心:授权之后,Manus 会不会“顺便”看我其他标签页的内容?这里有个重要的边界:

  • 它只在被授权的标签页里操作,不会随意切到你正在浏览的私人页面;
  • 遇到支付、签约等敏感步骤,会自动暂停,等你确认后再继续,或者直接交还控制权;
  • 敏感数据留在本地浏览器环境里,不会被当成训练数据到处乱飞。

有用户专门做过测试:在同一浏览器里同时开着个人社交账号和工作系统,Manus 只会在被授权的工作标签页里操作,对其他页面完全“视而不见”。这种“看得见边界”的体验,比那种什么都不说的黑箱自动化要可靠得多。

3 种高效用法:把下午的多标签页工作交出去

一旦授权完成,你就可以把那些本来要耗掉一整个下午的多标签页流程交给浏览器操作符。下面是我自己常用的三种方式,从简单到复杂排个序。

1. 规划团队差旅并自动填写预订表单

团队团建、出差安排这种事,最容易把人拖进“多标签页地狱”。一边是 Google Maps 看位置,一边是 Booking.com 或 Airbnb 看价格和评分,还要兼顾预算、交通时间和会议地点距离。稍微一走神,就忘了刚才看的是哪家酒店。

我会把这种分页和对比工作交给 Manus。提示词大概是这样:

“我在帮同事订酒店,所以忽略 Booking.com 上任何预填的账号信息,只用我之后给你的入住人信息。用 My Browser 在 Booking.com 搜索 10 月 12-15 日芝加哥市中心的酒店,筛选 4 星及以上、每晚不超过 300 美元。对排名前 3 的结果,用 Google Maps 查看步行到 McCormick Place 会展中心的时间。在聊天里总结这 3 家的价格、评分和步行时间,方便我选择。”

Manus 浏览器操作符演示

Manus 会自动打开预订网站,设置日期和筛选条件,再切到地图核算通勤时间,最后在对话里给出一个干净的 Top 3 总结。等我选定酒店后,再发一个后续指令,让 Manus 开始预订并填写入住人信息。到信用卡支付那一步,它会自动停下,把浏览器控制权交还给我,让我自己安全完成付款。

2. 做设备采购清单,不再被标签页淹没

批量采购设备时,真正耗时的是前期调研:翻零售网站、躲赞助位、抄价格、看评论,生怕买到一批“雷品”。有一次我们要给新办公室配升降桌,我一个人开了二十多个商品页,光是看差评就看晕了。

现在我会直接把这段调研外包给 Manus。提示词可以是:

“我要为办公室采购升降桌。用 My Browser 在沃尔玛搜索相关产品,跳过赞助结果,打开排名前 4 的自然搜索结果。对每个产品,提取价格和平均评分,并总结最关键的 3 条差评,帮我提前发现耐用性或安装问题。最后整理成一个干净的对比表,方便我直接放进采购说明。”

Manus 采购对比演示

Manus 会在你当前浏览器标签页里打开零售网站,过滤掉赞助结果,逐个进入产品页。它会用自己的 Wide Research 能力把所有评论扫一遍,把价格、评分和风险点结构化成对比表。我拿到的是一份“可以直接拍板”的候选清单,而不是一堆还要自己整理的原始信息。

3. 从 Substack 订阅里拉出一份研究简报

很多人真正依赖的深度分析,其实藏在自己订阅的 Newsletter 里,比如 Substack 上的专栏。以 Lenny's Newsletter 为例,里面关于 AI Agent、变现模式、产品策略的文章质量都很高,但你很难有时间一篇篇打开、逐字读完,再手动做笔记。

我会让 Manus 替我做这一轮“研究性阅读”。提示词类似这样:

“我在梳理一个观点:AI 如何重塑产品变现和 Agent 策略。用 My Browser 打开 Substack,进入 Lenny's Newsletter,找到最近 30 天内最相关的文章,完整读一遍,提炼关键论点。帮我做一个 Dashboard,列出最有力的观点、每篇文章使用的支撑证据,以及在这些文章中反复出现的开放问题。”

Manus 阅读订阅内容演示

因为 Manus 是在你授权的浏览器会话里运行,它会继承你已经登录的状态。如果这份 Newsletter 是你付费订阅的,它就能像你自己点开邮件那样,访问完整文章。它会从头到尾读完,再把论点、证据和开放问题整理成一个清晰的 Dashboard。你得到的是一份“研究级”的主题简报,而不是几段零散的摘要。

让 Agent 真正“长出一双手”

Agent 不该被关在聊天框里

一个真正有用的 AI Agent,不应该被困在聊天窗口里,只会回你几段文字。它需要一个完整的工作环境:可以跑代码的沙箱、可以上网的浏览器、可以连接外部服务的各种连接器。这些东西加在一起,才是 Agent 的“手脚”。

当 Agent 能够使用浏览器时,它就从“总结信息”升级为“基于信息采取行动”。比如,不只是告诉你哪家酒店好,而是直接帮你筛选、对比、填写预订表单;不只是解释某个政策,而是帮你在官网上找到对应的申请入口并走完流程。很多人第一次看到 Manus 在自己浏览器里自动点来点去时,都会有点惊讶:原来 AI 真能替我干这么多“鼠标活”。

透明协作:你永远是那个“最后拍板的人”

浏览器操作符直接在你本地浏览器环境里工作,也意味着它天然尊重你的边界。敏感信息留在你的机器上,Agent 只会访问你授权的内容。整个协作模式建立在“透明”之上:

  • 你可以实时看到它在哪个页面、在做什么操作;
  • 任何时候都能打断、接管,尤其是遇到支付、签约这类关键步骤;
  • 任务结束后,可以回放整个过程,确认每一步是否符合预期。

有用户形容这种体验:“更像一个很能干的实习生坐在你旁边,你看着他操作,随时可以说‘这一步我来’。”自动化不该是一个让人紧张的黑箱,而是一个你愿意把真实工作交给它、又始终掌握主动权的伙伴。

当你习惯了这种协作方式,会发现一个有趣的变化:你把更多时间花在判断、沟通和创造上,而不是在网页之间来回切换。这个判断方法反复用下来都挺靠谱,值得你留着慢慢试。

常见问题

Q:Manus 浏览器操作符会不会偷偷访问我没授权的网站?

A:不会。它只能在你明确授权的标签页和会话里操作,无法随意切换到其他页面。原因在于它是通过浏览器扩展和“My Browser”连接器受控运行的,每次接管新标签页都需要你的确认。实际使用时,你可以把敏感个人浏览和工作浏览分在不同窗口,Manus 只会在你指定的那一块动手。建议你在授权前先检查当前打开的标签页,把不希望被看到的页面单独关掉或移到另一个窗口,以增加安全感。

Q:用浏览器操作符处理支付或签约流程安全吗?

A:相对安全,但关键一步仍然需要你亲自完成。浏览器操作符会在本地浏览器里帮你填表、核对信息,一旦检测到支付页面或电子签名步骤,就会自动暂停,等待你接管。这样设计的原因是,支付信息和签名具有高度敏感性,任何全自动填写都可能带来合规和风控问题。建议你让 Manus 负责“准备工作”(比价、填表、检查),在涉及银行卡、密码、签名时亲自操作,并定期检查浏览器扩展的权限设置。

Q:跨设备使用浏览器操作符时,我的账号会不会更容易被风控?

A:只要你遵守正常的登录习惯,风险可控。跨设备本质上是让 Manus 在你已经登录的浏览器会话里工作,而不是频繁在不同 IP 上重新登录账号。很多平台的风控是针对异常登录行为的,比如短时间内在多个国家/地区登录同一账号。建议你:在固定的几台设备上使用 Manus,不要在公共电脑上长期保持登录;涉及银行、证券等高敏感账号时,尽量只在一台受信任设备上授权浏览器操作符;一旦收到平台异常登录提醒,及时修改密码并检查授权设备列表。

Q:如果 Manus 在网站上“点错了”,我还能挽回吗?

A:大多数情况下可以,因为你始终可以中断并回滚关键操作。浏览器操作符的行为是可见的,你能实时看到它在哪个页面、点了什么按钮。一旦发现走错路径,可以立即停止任务,手动返回上一步或刷新页面。对于不可逆的操作(比如提交表单、确认订单),Manus 在设计上会尽量在提交前停下来让你确认。建议你在提示词里明确写上“在提交前停下来让我确认”,并在第一次跑新流程时全程盯一遍,确认它的行为符合预期后再放手让它批量执行。

Q:我不会写很复杂的提示词,还能用好浏览器操作符吗?

A:可以,只要把“你平时怎么做这件事”用口语说清楚就行。浏览器操作符最需要的信息是:目标是什么、要访问哪些网站、有哪些硬性条件(预算、时间、数量等)、哪些步骤必须停下来让你确认。原因在于,它是按你的意图拆解成一系列网页操作的,不需要你写脚本,只要像给同事布置任务那样描述。建议你从一个小任务开始,比如“帮我在某网站找 3 个评价最好的产品并做对比”,观察它的行为,再逐步增加复杂度,这样上手会更轻松。