关于ZAKER Skills 合作
钛媒体 23小时前

浏览器成了 AI 主战场,但我劝你别乱换

文 | AI 唱反调

2026 年,浏览器成了 AI 行业最热闹的战场。

美团做了 Tabbit,阿里升级了夸克,字节推了豆包。对外口径出奇一致,这不是浏览器,是 AI Agent:能懂你、帮你、替你操作网页。

听起来很诱人。但当我把三款产品放在同一台电脑、同一个 WiFi 下,全部未登录,跑了一整天真实工作流之后,结论比想的还要两极:

有的连网页都抓不准,有的把 " 深色模式 " 做成登录福利,有的确实能替你跑出 Excel 表格。

一句话:一家真会,一家诚实说不会,一家在假装。

测试从全部未登录开始,这是底线——如果一款浏览器连 " 打开就能用 " 都做不到,它所谓的 " 免费 " 就有水分。

基础浏览:10 个站点过关,顺手又开了几个常用页

先验证基本功。B 站看视频、知乎刷长文、微博追热点、虎嗅读资讯、京东淘宝看 618 预热,再加上几个常用站。三款都是 Chromium 内核,10 个站点全部正常打开,视频、弹幕、电商弹窗都没问题。

兼容性过关后,我顺手又打开了自己常用的后台和资讯站:少数派、GitHub、Stack Overflow、36 氪、钛媒体,再加上前面已经开着的标签,凑到 15 个。这时候差距出来了:Tabbit 和夸克内存都控制在 1.6GB 左右,豆包直接冲到 2GB+。多出来的 400MB 不是白占的,但用户得到了什么?一个更空的启动页。

随后打开 TechCrunch 看一篇英文报道,翻译和广告拦截的差异显现出来。豆包最积极,自动汉化导航栏,双语对照直接呈现。夸克有手动翻译面板,还算好用。Tabbit 没触发自动翻译,得手动找。广告拦截也是,虎嗅首页三家都干净,但 Tabbit 在 TechCrunch 漏了七牛云 CDN 横幅。

夜间模式有个意外发现。 Tabbit 和夸克在设置里直接能找到。豆包在未登录状态下翻遍设置没有,直到后面找隐私设置时,才发现登录后突然冒出了 " 深色模式 " 选项。一个深色模式也要靠登录解锁,这个 " 免费 " 的边界感,豆包划得很暧昧。

这一模块,夸克表现最稳,拿到 85 分;豆包 82 分,输在内存和夜间模式门槛;Tabbit 78 分,翻译和广告拦截有短板。

AI 对话:Tabbit 弹窗要登录,豆包数学推导最清晰

下午开始测 AI 大脑。此时三款均未登录

三点钟,咖啡送到。我顺手找了篇中国咖啡产业的深度分析,将近 3000 字,有数据、有时间线、有品牌案例,适合测总结能力。要求三款 AI 控制在 300 字内,分点列出。

Tabbit 直接弹窗:请登录手机号。 这是整个测试里第一个实质性门槛,夸克和豆包未登录就能用 AI,Tabbit 必须登录。登录后,Tabbit 的总结最全面:四阶段演进、供应链细节、文化悖论全在。但字数飙到 500+,把 "300 字内 " 当耳旁风。豆包最均衡:四阶段骨架保留,字数合规,数据准确。夸克最简洁,但丢了原文最核心的 " 四阶段 " 时间线,且把 "35 年历史 " 和 "2600 亿市场规模 " 并列,容易让人误解。

矛盾数据陷阱(用户数增 300%,收入只增 20%): Tabbit 分析最深入,但极度冗长,飙到 1200 字 +。夸克简洁有力,但冒出一句 " 复购率不足 15%",无推导过程。豆包唯一做了数学推导:设 2023 年为 A × P,2024 年客单价 =0.3P,暴跌 70%。量化感最强,逻辑最清晰。

多模型对比是 Tabbit 独有卖点。让 DeepSeek、Kimi、GLM 同时回答 " 咖啡为什么没替代茶 ",三家给了三个不同角度:DeepSeek 讲 " 场景割裂 ",Kimi 讲 " 互补关系 ",GLM 讲 " 文化身份 "。夸克和豆包的单模型给不出这种横向视角。

连续对话记忆 测了三轮。第一轮自我介绍 " 我叫刘五,从事新媒体运营 ",第二轮要选题,第三轮要大纲。Tabbit 和豆包全程记得 " 刘五 " 和 " 第一个选题 "。夸克未登录时前两轮正常,第 三轮生成大纲时强制弹窗要求登录夸克网盘,登录后才完成。这说明夸克的免费零门槛有深度限制。

创意写作要求写一段加班到凌晨的文字,禁用 " 悲伤 "" 难过 "" 孤独 "。Tabbit 画面感极强:" 键盘推进显示器下方,顺手捏了捏后颈,那里硬得像块石头 "" 感应灯啪地亮了一排,又在他走过之后一段段熄灭 "。夸克文艺腔。豆包翻车:" 心里没有波澜,只剩一份踏实的释然 ",感受词堆砌,套路化。

这一模块,Tabbit 内容质量最高但扣分在字数控制和登录门槛,拿到 82 分;豆包 80 分,数学推导和未登录体验是亮点;夸克 75 分,第三轮登录打断是硬伤。

Agent 自动化:这是真正的分水岭,也是照妖镜

继续测核心能力。此时 Tabbit 已登录,夸克在连续对话测试中已经登录,豆包仍保持未登录。

知乎热榜提取: Tabbit:自动访问 zhihu.com/hot,提取前 5 个话题,附带热度数据,还能导出 Excel。内容与实时页面完全一致。 夸克:诚实回答 " 我无法直接访问实时网页 "。 豆包:灾难级幻觉。 返回的 5 个热榜话题与实时页面完全不符:张雪机车、蒸汽机、日本炸鸡店、微信收费、NBA 总决赛,全是编的。且自信标注 " 结合当前知乎热榜实时数据 "。

跨页比价(京东 vs 淘宝,蓝牙耳机): 正好快 618,我想买副蓝牙耳机,在京东和淘宝之间比价。Tabbit:Agent 全自动。开标签→导航→搜索→截图→提取→生成 Excel 表格,带颜色区分和货币格式。不到 5 分钟,零人工干预。 夸克:诚实承认 " 无法直接控制浏览器 "。 豆包:给了一份 " 操作步骤 + 比价表格模板 ",但表格是空的,下方 " 示例 " 数据是模拟的。用教学文档假装 Agent 能力。

复杂任务(36 氪 + 钛媒体文章提取): Tabbit:自动打开 36kr.com 和 tmtpost.com,提取首页前 5 篇文章标题和发布时间,生成 Excel。全程仅需最初点击 " 执行 " 确认。 夸克和豆包:无此能力。

这一模块是分水岭。Tabbit 拿到 95 分,夸克 30 分,豆包 15 分。夸克和豆包得分低不是因为 " 做得差 ",而是因为 " 没有这项能力 " ——它们目前只提供 AI 对话辅助,无法操作网页。

微信文章导出:测了两轮,夸克两次都抓来同一份错误文档

测试微信文章导出时,第一轮指令是 " 整理为正式文档 "。结果 Tabbit 和豆包都做了 AI 二次加工,不是原文直出。夸克导出的文件标题变成 " 微信公众号文章下载器 STDT v3.0" ——这是一个真实存在的开源爬虫项目,但与我们给的原文《周靖人没走,但阿里 AI 的决策层正在慢性消耗》毫无关系。

第二轮修正指令:" 不整理,直接原文导出。"

Tabbit:听懂指令,输出 DOCX+PDF 双格式,42 段落 /6 页内容完整。但丢失大小标题,无图片。 夸克:仍然给了那个 " 微信公众号文章下载器 STDT v3.0" 的文档,和第一次一模一样。巧合的是,这篇原文恰好涉及阿里内部人事变动,而夸克作为阿里系产品,两次导出都出现内容错位,对微信生态内容的抓取存在系统性兼容障碍。豆包:这次没有生成任何文件,只给了一份 " 手动操作指南 ",让你自己复制粘贴到 Word 里。它坦诚了自己 " 无法远程访问外部网页抓取原生源码 ",但这也意味着,在 " 直接原文导出 " 这个需求上,豆包交了白卷。

这一模块,Tabbit 70 分,豆包 55 分,夸克 20 分。

生态捆绑与隐私边界

生态测试方面,Tabbit 搜 " 外卖 " 首条美团、次条京东外卖,右侧联想词中立,捆绑程度 3/10;夸克搜 " 网盘 " 首条夸克网盘带 " 官网 " 蓝标置顶,右侧有 " 夸克热搜 " 自家栏目,捆绑程度 6/10;豆包搜 " 抖音热点 " 首条抖音但无强引导,捆绑程度 2/10。这块涉及平台导流,观感像广告,原始截图就不放了,需要原始记录的读者可以找我要。

隐私与性能方面,三款均未触发免费额度限制。高负载稳定性过关,一天测下来无闪退。隐私设置方面,Tabbit 和夸克都有无痕模式,豆包在隐私政策里也有相关选项。

这两个模块合并,Tabbit 80 分,夸克 75 分,豆包 78 分。

总分与最终判决

五个模块按权重加权,最终得分如下:

Tabbit 总分 82.35。 适合愿意折腾的职场人、数据分析师、运营。Agent 自动化是真能力,多模型对比是真差异化。代价:必须登录,对 " 字数限制 " 类指令遵循度差,基础工具有短板。它像一台功能强大的专业设备,上限高,下限也有明显缝隙。

夸克总分 57。 适合学生、轻度用户。网页翻译好用,广告拦截干净,分析简洁有力,诚实不幻觉。但 Agent 能力为零,深度内容触发登录弹窗,生态捆绑感最强。它是个 " 好用的 AI 搜索框 ",不是 Agent。

豆包总分 59.8。 适合大众用户、零门槛尝鲜。未登录体验最完整,数学推导清晰,自动翻译积极。但 Agent 能力灾难级(幻觉 + 伪装),创意写作套路化,内存偏高。它是 " 最友好的 AI 聊天窗口 ",但千万别让它帮你操作网页,它说的 " 实时数据 ",可能是编的。

最终结论:如果你需要的是 " 能自动填表、比价、抓数据、导 Excel 的数字实习生 ",Tabbit 是唯一选项。如果你只需要 " 一个干净、诚实的 AI 搜索助手 ",夸克比豆包更可靠。Agent 浏览器的战争才刚开始,目前市面上的产品,上限都在快速提高,下限却参差不齐——选谁,取决于你能容忍哪种错误。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容