对话冯雷：从 AI 播客，到真人感 Agent

当下 AI 圈几乎每周都有新鲜事发生，这反而给了许多创业公司熬出头的机会。（雷峰网雷峰网雷峰网）

无论是 Clawedbot 掀起对物理世界交互方式的重构，还是 Moltbot 上开始讨论 AI 和人类如何共存的危机感，都在提醒市场：真正的机会往往藏在边缘地带，以及看似微小的‘非共识’时刻。

比如 " 播客 " 这个领域，即便有短视频和短剧的大力冲击，但是播客赛道仍旧火热，根据《CPA 中文播客白皮书 2026》显示，2025 年中文播客听众人数已突破 1.5 亿人，较 2023 年的 1.2 亿增长 25%。

在大量研究国外对播客的论文文献之后，创始人冯雷决定选择 AI 播客这条赛道，其创业路径非常清晰：我们的目标不是 DAU，而是要做一个赚钱的 AI 产品，专注于 1%-3% 以内的创作者，这群人很有创造力，也愿意付费，我们就服务这群人。

" 我们就是希望他像一个真人一样，没有太多 AI 表达。尽量有人味，越自然越好。" 冯雷对 AI 科技评论表示。

ListenHub 创始人冯雷

作为一家在播客生成领域做到国内头部的公司，ListenHub 选择为内容创作者提供声音克隆、多模态编辑、一键生成解说视频等专业工具。

公司去年底实现了 300 万美金的 ARR，并在近期以 5000 万美金的估值开启新一轮融资。

在成为一名创业者之前，冯雷是 Minimax 海螺 AI 的产品负责人，最广为人知的是他的个人公众号 " 有机大橘子 "，更早期在 BOSS 直聘、兰亭集势、三星等公司就职就职，从事产品经理相关职位。

在对 PMF 的理解上，他指出：在传统互联网时代，产品经理的核心任务是 " 发现需求 - 验证模型 - 规模化复制 "，流程清晰如流水线；而在 AI 时代，他坦言这套方法论已经失效—— " 真的是拿锤子找钉子，而且还真的能找到 "。

这种反常识的颠倒，源于大模型作为通用技术的特殊性，因此在招聘时，冯雷也会警惕经验主义者，"3 年以上的产品经理容易陷到过去的方法论里 "；他坚持定 ARR 而非 DAU 目标，也会将产品核心交给工程师和 AI 本身，信奉 Manus 那句 "less structure, more intelligence" ——当技术本身具备涌现能力时，人的任务不是控制，而是守护那 1% 的灵魂。

在这次对话中，冯雷展现了一个 AI 创业者的清醒与坦诚。他不讳言对大模型降本论的质疑—— " 去年大家最大的错误判断就是相信模型降价能带来利润空间 "；他也直言当前 AI 应用公司的困境—— " 调用 Claude 的公司利润都很低，ARR 只是给 Claude 交的税 "；他甚至略带自嘲地承认 " 现在的英文模型效果依然不够好，一定程度上影响了海外的 GTM"。

这篇对话记录不仅是对 ListenHub 成功的复盘，更是为当下 AI 创业者呈现出的另一个参考样本：

01 关于 ListenHub 产品现状

AI 科技评论：ListenHub 目前进展如何？在市面上各种 AI 产品都在卷 DAU 的时候，你们怎么选择？

冯雷：去年底我们做到了 300 万美金的 ARR，和豆包相比，它的目标是做中国 DAU 第一的 AI 产品，做的是大众生意。但我们的目标是做一个赚钱的 AI 产品。我们服务的核心人群可能只占全网用户的 1% 到 3%，就是那些有创造力、愿意付费的创作者。我们增加了声音克隆、编辑模式等他们需要的功能，这样与大厂形成正交关系，没有直接竞争。

AI 科技评论：既然是给创作者用的工具，为什么选择 "AI 播客 " 这个切入点？短视频不是更火吗？

冯雷：播客是一个很神奇的存在。短视频冲击了这么多年，听播客的人不仅没少，反而变多了。这说明它里面有一种不可替代的 " 深度表达 " 需求。

ListenHub 做到了国内第一，核心特色在于 " 像人一样自然的表达 "。我们不是在做表演，而是在做沟通。现在的 AI 能把解说视频做得非常有 " 人味儿 "，这种自然感是用户买单的关键。而且，我们正在从音频向视频、PPT 拓展，流量池会更大。

AI 科技评论：ListenHub 的商业模式是一开始就确定的吗？

冯雷：是逐渐在创业过程中探索而来的。最初尝试情感电台方向—— AI 个性化推送情感故事，支持聊天并按对话收费。但该方向用户付费意愿有限，工具属性反而更易变现，因此自然转向迭代，逐步加入视频、图片、解说等功能。

02 技术路径与产品体验

AI 科技评论：你们现在主要使用哪些模型？国内外模型使用的差异性在哪里？

冯雷：我们主要用海外的原生多模态模型。比如把 PDF 或 Youtube 视频直接 " 洗 " 成一篇高质量的播客稿件，这需要极强的长窗口和多模态理解力。

我们也会用到一些国内的模型，比如 Qwen、Minimax、字节（豆包）在中文处理上都不错。但问题出在英文和多语言上。因为我们要出海，服务海外用户和海外华人，所以必须依赖海外模型。

AI 科技评论：产品最主要的技术指标是什么？是声音还原度还是文本流畅？

冯雷：分几块：文本方面希望像真人一样，没有太多 "AI 味 "；声音方面越自然越好，保持播客轻松的状态；图片方面要给用户足够信息量，同时精美并符合用户要求。

AI 科技评论：让 AI" 没有人味 " 是通过提示词工程实现的吗？

冯雷：整体是一套标准的 " 上下文工程 "。前置处理包括各种输入（YouTube、PDF 等），基于讲解场景整理核心信息，然后按照播客场景处理。分两步：一是搭架构（像建房搭结构），二是润色表达（像装修和外墙），最终形成好内容：第一，要有信息量、有干货知识性；第二，表达要吸引人，能让人听完（比如 3 分钟完播率），内容再好没人听也不行；第三，要有内在逻辑，让人听完能改变行为。对创作者来说，还需要节奏、韵律，让粉丝听完想听下一个，这三者要结合。

03 商业模式与创业思考

AI 科技评论：现在市场上有做 " 套壳 " 集成的（如 Manus），也有自研模型的，这两种模式怎么看？

冯雷：如果钱足够，还是会训模型。模型公司追求更高的上限，比如 Coding 是个大市场，只有自己训模型，在大规模用户下利润率才算得过来。应用公司调用 API（如 Claude）其实很难有高利润，大部分收入都交给模型厂商了（像交税一样）。

AI 科技评论：既然模型成本这么高，前两年说的 " 模型降价 " 似乎没有给应用公司带来特别大的成本空间？

冯雷：这可能是去年大家最大的错误判断。降价发生在模型能力到达阈值之前，那时候模型没那么有用，只能靠降价扩张，或者像 OpenAI 这样追求超高速覆盖率。但一旦突破阈值（如谷歌的图片模型，一块钱一张图，很贵，不降价都供不应求），顶级模型就变成了商品。

AI 科技评论：所以现在做应用必然烧钱？

冯雷：会烧钱，但要合理地烧。不能像互联网时代那样免费换规模。AI 时代没有网络效应，必须建立健康的经济模型。

AI 科技评论：公司目前融资进展如何？资金可支撑多久？

冯雷：正在推进新一轮融资，上一轮天际投完之后估值达到约 2000 万美元。Q4 ARR 增至 300 万美元，本轮按 5000 万美元估值进行融资，年底目标估值 1 亿美元。

当前资金可支撑两年以上。下一轮融资完成后可支撑五年。

AI 科技评论：创业公司资金有限，如何控制成本？

冯雷：主要成本在 Token 上。我们设定规则：任何创业项目初始预算为 1000 美元 Token 费用。若上线一天内耗尽，说明项目有潜力，公司追加投资；若项目走红但成本可控，也不会造成损失。以预算作为约束机制，核心目标是 ARR。

该机制自去年 10 月 " 任务酒馆 " 改革后实行。任务公开发布，成员自主认领，独立完成从开发到验证的全流程，预算内 API 费用实报实销。

但尝试也需要主线和方向。我们的主线是帮助人表达——通过多模态技术增强表达能力。技术与人文结合，目标人群明确（创作者、学生、教师），在此范围内可自由尝试，但需避免偏离核心（如短剧属于表演而非表达，不在范围内）。

04 AI 时代的产品方法论

AI 科技评论：如果中厂、大厂把 TPMF 做得很好，纯做 PMF 的公司会受到冲击吗？

冯雷：训模型的公司普遍开放 API，因其自有场景不足，需要用数据持续优化模型。模型公司与我们合作时也会协助微调模型，目标同样是提升模型能力。因此在这一层面，双方利益一致——场景上各取所需，ROI 不同，但都希望用数据让模型更强。若模型公司真能覆盖所有场景，便不会开放 API。

AI 科技评论：AI 时代做产品，与过去寻找 PMF 有何不同？

冯雷：完全不同。过去需求与技术相对确定，产品只需找到连接点，固化 workflow，发现盈利路径后迅速规模化，借助网络效应扩张。

AI 时代则相反：用户场景与模型训练者的预设往往不一致，因此产品、运营、增长都无法先设定明确目标。例如马卡龙初期专注写作，但模型能力未达预期，方向错误只能放弃。

逻辑是倒置的：先构建通用技术，投入市场验证，发现匹配场景（如 PPT 高频且有价值），再针对性完善工程。这类似于 " 拿锤子找钉子 "，虽反常识，但通用技术确能找到适配场景。因此我们倾向招募 3 年以内经验的产品经理，资深者反而易受旧有方法论束缚。

AI 科技评论：在 MiniMax 时的产品思路与现在一致吗？

冯雷：当时尚处 Chatbot 早期，产品目标是服务模型迭代——获取数据、构建飞轮、提升模型能力，不关注产品数据或营收，只追求技术上限。

当前环境对产品经理挑战更大：技术变量不由产品主导，因此需摒弃 ego。我们公司工程师地位很高，拥有充分决策权。我不会以 15 年产品经验自居进行指导，而是聚焦目标设定。目标选择至关重要—— DAU 目标会导致团队动作变形，ARR 目标在前两年都更有效，因其倒逼真实增长与付费转化。

我们正培养工程师的端到端能力：从用户需求验证（工程师直接参与用户社群）、商业模式设计到产品上架，全流程参与。将产品经理培养成全栈成本过高，而将工程师培养成具备产品决策能力的全栈人才更具性价比，这是我们的核心方法论。

AI 科技评论：公司当前主线是什么？是否会涉足数字人和陪伴类产品？

冯雷：数字人和陪伴类暂不涉及。完成现有表达类产品后，我们认为智能表达已较为成熟。长期目标是构建 Agent ——本质上是模拟完整的人。除表达外，还需具备思考能力、意图理解能力和执行能力。表达能力已夯实，现正推进完整 Agent 的研发。

内部从去年 8 月开始就已经在开发一款语音交互驱动的桌面 Personal Agent 产品，支持语音对话，长期记忆，控制电脑，使用网络。我们将 ListenHub 里积累的真人感的表达理念和技术积累注入到全新的 Agent 产品中，力图打造出第一个具有真人感的 Agent。

目前该产品正在紧张的内测中，最早在春节后会跟大家见面。（本文作者长期关注 AI 应用以及创业者故事，欢迎加微信 Who123start 畅聊探讨）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

对话冯雷：从 AI 播客，到真人感 Agent

宙世代

一起剪

相关阅读

雷军的世纪难题：初代小米SU7该召回吗？

保险业开始把AI风险写进条款

华为Mate 80系列累计销量达377.96万台 红枫影像加持

中国AI的“成本奇迹”能持续多久——一个三角结构的脆弱与韧性

“比赛穿安踏，领奖穿李宁”，谁是冬奥会最大赢家？

春节AI战报B面：大厂抢面子，小厂赚里子

汉堡王给员工戴上 AI 耳机：你的每一句「谢谢」，都在被 AI 打分

1100亿美元的阳谋：OpenAI融资破局，亚马逊与英伟达如何瓜分AI霸权？

智能手机今年遭史诗级打击！出货量将创历史最大跌幅

Nano Banana 2 的 5 个神级玩法，还是 AI 生图的神，建议收藏（附提示词）

新一代V单！vivo X300 Ultra官宣下周首次亮相

对话NOOK创始人许清岚：AI 从「做事」走向「规划人生」

9个月净赚3.8亿，80后山东老板赴港IPO，阿里系俞永福为公司大股东

苹果全新iPad 12下周发布：外观不变 重磅升级A19芯片

专访周生生集团执行董事兼首席品牌长周嘉颖：从保值到悦己再到信任 黄金消费的三次跨越

最新评论

雷峰网

热门推荐

华为Mate 80系列累计销量达377.96万台红枫影像加持

苹果全新iPad 12下周发布：外观不变重磅升级A19芯片

专访周生生集团执行董事兼首席品牌长周嘉颖：从保值到悦己再到信任黄金消费的三次跨越