文 | AI 唱反调
2026 年,浏览器成了 AI 行业最热闹的战场。
美团做了 Tabbit,阿里升级了夸克,字节推了豆包。对外口径出奇一致,这不是浏览器,是 AI Agent:能懂你、帮你、替你操作网页。
听起来很诱人。但当我把三款产品放在同一台电脑、同一个 WiFi 下,全部未登录,跑了一整天真实工作流之后,结论比想的还要两极:
有的连网页都抓不准,有的把 " 深色模式 " 做成登录福利,有的确实能替你跑出 Excel 表格。
一句话:一家真会,一家诚实说不会,一家在假装。
测试从全部未登录开始,这是底线——如果一款浏览器连 " 打开就能用 " 都做不到,它所谓的 " 免费 " 就有水分。
基础浏览:10 个站点过关,顺手又开了几个常用页
先验证基本功。B 站看视频、知乎刷长文、微博追热点、虎嗅读资讯、京东淘宝看 618 预热,再加上几个常用站。三款都是 Chromium 内核,10 个站点全部正常打开,视频、弹幕、电商弹窗都没问题。
兼容性过关后,我顺手又打开了自己常用的后台和资讯站:少数派、GitHub、Stack Overflow、36 氪、钛媒体,再加上前面已经开着的标签,凑到 15 个。这时候差距出来了:Tabbit 和夸克内存都控制在 1.6GB 左右,豆包直接冲到 2GB+。多出来的 400MB 不是白占的,但用户得到了什么?一个更空的启动页。






这一模块,夸克表现最稳,拿到 85 分;豆包 82 分,输在内存和夜间模式门槛;Tabbit 78 分,翻译和广告拦截有短板。
AI 对话:Tabbit 弹窗要登录,豆包数学推导最清晰
下午开始测 AI 大脑。此时三款均未登录。
三点钟,咖啡送到。我顺手找了篇中国咖啡产业的深度分析,将近 3000 字,有数据、有时间线、有品牌案例,适合测总结能力。要求三款 AI 控制在 300 字内,分点列出。
Tabbit 直接弹窗:请登录手机号。 这是整个测试里第一个实质性门槛,夸克和豆包未登录就能用 AI,Tabbit 必须登录。登录后,Tabbit 的总结最全面:四阶段演进、供应链细节、文化悖论全在。但字数飙到 500+,把 "300 字内 " 当耳旁风。豆包最均衡:四阶段骨架保留,字数合规,数据准确。夸克最简洁,但丢了原文最核心的 " 四阶段 " 时间线,且把 "35 年历史 " 和 "2600 亿市场规模 " 并列,容易让人误解。



多模型对比是 Tabbit 独有卖点。让 DeepSeek、Kimi、GLM 同时回答 " 咖啡为什么没替代茶 ",三家给了三个不同角度:DeepSeek 讲 " 场景割裂 ",Kimi 讲 " 互补关系 ",GLM 讲 " 文化身份 "。夸克和豆包的单模型给不出这种横向视角。



创意写作要求写一段加班到凌晨的文字,禁用 " 悲伤 "" 难过 "" 孤独 "。Tabbit 画面感极强:" 键盘推进显示器下方,顺手捏了捏后颈,那里硬得像块石头 "" 感应灯啪地亮了一排,又在他走过之后一段段熄灭 "。夸克文艺腔。豆包翻车:" 心里没有波澜,只剩一份踏实的释然 ",感受词堆砌,套路化。



Agent 自动化:这是真正的分水岭,也是照妖镜
继续测核心能力。此时 Tabbit 已登录,夸克在连续对话测试中已经登录,豆包仍保持未登录。
知乎热榜提取: Tabbit:自动访问 zhihu.com/hot,提取前 5 个话题,附带热度数据,还能导出 Excel。内容与实时页面完全一致。 夸克:诚实回答 " 我无法直接访问实时网页 "。 豆包:灾难级幻觉。 返回的 5 个热榜话题与实时页面完全不符:张雪机车、蒸汽机、日本炸鸡店、微信收费、NBA 总决赛,全是编的。且自信标注 " 结合当前知乎热榜实时数据 "。






这一模块是分水岭。Tabbit 拿到 95 分,夸克 30 分,豆包 15 分。夸克和豆包得分低不是因为 " 做得差 ",而是因为 " 没有这项能力 " ——它们目前只提供 AI 对话辅助,无法操作网页。
微信文章导出:测了两轮,夸克两次都抓来同一份错误文档
测试微信文章导出时,第一轮指令是 " 整理为正式文档 "。结果 Tabbit 和豆包都做了 AI 二次加工,不是原文直出。夸克导出的文件标题变成 " 微信公众号文章下载器 STDT v3.0" ——这是一个真实存在的开源爬虫项目,但与我们给的原文《周靖人没走,但阿里 AI 的决策层正在慢性消耗》毫无关系。
第二轮修正指令:" 不整理,直接原文导出。"
Tabbit:听懂指令,输出 DOCX+PDF 双格式,42 段落 /6 页内容完整。但丢失大小标题,无图片。 夸克:仍然给了那个 " 微信公众号文章下载器 STDT v3.0" 的文档,和第一次一模一样。巧合的是,这篇原文恰好涉及阿里内部人事变动,而夸克作为阿里系产品,两次导出都出现内容错位,对微信生态内容的抓取存在系统性兼容障碍。豆包:这次没有生成任何文件,只给了一份 " 手动操作指南 ",让你自己复制粘贴到 Word 里。它坦诚了自己 " 无法远程访问外部网页抓取原生源码 ",但这也意味着,在 " 直接原文导出 " 这个需求上,豆包交了白卷。


生态捆绑与隐私边界
生态测试方面,Tabbit 搜 " 外卖 " 首条美团、次条京东外卖,右侧联想词中立,捆绑程度 3/10;夸克搜 " 网盘 " 首条夸克网盘带 " 官网 " 蓝标置顶,右侧有 " 夸克热搜 " 自家栏目,捆绑程度 6/10;豆包搜 " 抖音热点 " 首条抖音但无强引导,捆绑程度 2/10。这块涉及平台导流,观感像广告,原始截图就不放了,需要原始记录的读者可以找我要。
隐私与性能方面,三款均未触发免费额度限制。高负载稳定性过关,一天测下来无闪退。隐私设置方面,Tabbit 和夸克都有无痕模式,豆包在隐私政策里也有相关选项。
这两个模块合并,Tabbit 80 分,夸克 75 分,豆包 78 分。
总分与最终判决
五个模块按权重加权,最终得分如下:

夸克总分 57。 适合学生、轻度用户。网页翻译好用,广告拦截干净,分析简洁有力,诚实不幻觉。但 Agent 能力为零,深度内容触发登录弹窗,生态捆绑感最强。它是个 " 好用的 AI 搜索框 ",不是 Agent。
豆包总分 59.8。 适合大众用户、零门槛尝鲜。未登录体验最完整,数学推导清晰,自动翻译积极。但 Agent 能力灾难级(幻觉 + 伪装),创意写作套路化,内存偏高。它是 " 最友好的 AI 聊天窗口 ",但千万别让它帮你操作网页,它说的 " 实时数据 ",可能是编的。
最终结论:如果你需要的是 " 能自动填表、比价、抓数据、导 Excel 的数字实习生 ",Tabbit 是唯一选项。如果你只需要 " 一个干净、诚实的 AI 搜索助手 ",夸克比豆包更可靠。Agent 浏览器的战争才刚开始,目前市面上的产品,上限都在快速提高,下限却参差不齐——选谁,取决于你能容忍哪种错误。