文 | 最话 FunTalk,作者 | 林书,编辑 | 刘宇翔
虽然成本并非 3000 元,那只是 AI 算力成本,但 AI 短片《霍去病》还是让影视从业者们,感到了阵阵寒意。
看报价便知,《霍去病》制作团队向媒体提供的报价单显示,其商业视频每秒 100-500 元,影视视频每秒 100-300 元,CG 建模类视频每秒 300-1000 元,1 分钟影视短片最低成本仅 6000 元。而常规短剧单集制作成本 5 万元左右,特效镜头普遍 3000 元 / 秒的 CG 报价。也就是说用 AI 制作短剧,成本不足传统影视的十分之一。
这是连短剧领域的 " 郑州帮 " 都难以企及的成本优势。至于效果,对于短剧平台来说,短剧不过是消耗用户时间,以方便植入广告的消耗品。消耗品比起质量,更在乎数量,海量的 AI 短剧灌入,用户的偏好也很可能因此改变。
既然推荐算法 " 驯服 " 了用户的习惯,AI 制作也能改变用户的审美。这让整个影视圈宛如手持着冷兵器,面对铺天盖地而来的 " 机械章鱼 ",《黑客帝国》般的场景。
一开始所有人都没意识到改变会来得那么快,春节前,就在短剧剧组、公司经历了一整年红利,兴致勃勃准备开年再接再厉时,快手在 2 月 4 日连夜发布可灵 3.0 系列,字节跳动的 Seedance 2.0 在 2 月 7 日开启小范围内测,宣传片里,那些画面流畅、光影考究的片段,看得人心潮澎湃。
只要敲几行字,AI 就能把脑中的画面变成短剧,整个影视生产底层逻辑被重构了,剧本生成、角色建模、画面渲染、配音配乐等全流程均可通过 AI 工具完成。行业数据显示,AI 特效成本已压缩至传统模式的 5%-20%。曾经以技术、资金构筑的影视工业化门槛,被轻易击垮。
一位广告公司朋友告诉我们,过去拍宣传片,需要找编剧、导演、演员,租场地、设备,请剪辑、包装、配音,来来回回沟通。但现在输入创作需求,几小时就能出片,成本还不到原来的三分之一。
我的几位影视圈朋友心态更是复杂的,因募资不足赋闲已久的出品人兴高采烈跃跃一试,剪辑师已经好久没能接单,编剧朋友更是早就用 AI 写剧本。" 传统 " 从业者们被迫应对时,有 AI 加持的普通创业者与个人创作者反而涌入行业,进一步杀低报价。
似乎有了 AI,人人皆可当导演,人人皆可拍剧了。影视创造的城门已经洞开。
老实说,我一开始也是信了的。
01
前几天下午,我满怀期待地打开了这两个工具,然而,实际的体验,却让我打破了很多对当下视频 AI 的 " 幻想 "。
在以下测试中,上方的视频均为可灵 3.0,下方均为 Seedance 2.0。
最开始测试的,是复杂场景的理解力。
以下面这段视频为例,我输入的提示词是:
" 一对男女在咖啡馆里交谈,女子问男子:你相信吗?其实我们都是 AI,这个世界也都是模拟出来的,男子表示难以置信,之后,女子示意男子一起随她走出咖啡馆,两人走出后,发现外面是一片黄沙肆虐的废土,原先的高楼全都变成了废墟。"
讲真,可灵似乎没能准确 get 到我的意图,视频中,咖啡厅外的景象出现了诡异的漂移,最后高楼转成废墟的场景,也显得有些突兀。
相较之下,Seedance 2.0 的表现就自然了些许,不仅人物的神色拿捏得较为到位,并且在走出咖啡厅时,也展现了 " 出门 " 这一动作,而不是生硬地转场;
之后,我分别测试了二者在理解物理规律上的表现。
这方面,Seedance 2.0 和可灵 3.0,可谓半斤八两。
首先看可灵的表现:
提示词:一个烧红的铁球掉落在一大块透明冰块上。撞击时,冰块逼真地裂开,蒸汽瞬间升起,球体在冰上熔化出一个小坑,同时产生蜘蛛网状的裂纹。水在撞击点周围积聚。
从视频中的效果来看,铁球撞上的似乎是某种很脆的,易碎的固体,而非遇热即熔的冰块,冰块也并未因与灼热铁球的接触,而发生凹陷。
Seedance 2.0 在音色方面的表现略出色了些,出现了冒烟的滋滋声,冰块的融化声,但冰块仍然没有凹陷。
这说明二者在物理规律方面,仍然在靠数据和样本在模仿,而并非真正理解现实的物理规律。
之后,则是一段比较 " 人间 " 的物理性测试:
提示词:一辆载着 10 个高高叠起的不稳定披萨盒的送餐摩托车在街上飞驰。摩托车突然急刹车。车停了,但披萨盒堆因惯性逐个倒塌,最后掉落在路面上
这段案例,因为不像前面的铁球撞冰块那样,对物理规律有着严苛的要求,这方面的视频,因为有较多素材训练,因此二者表现尚可,都展现了披萨因惯性掉落的画面,
区别是可灵的表现似乎更有 " 镜头感 " 一些,还展示了披萨掉落后的些许细节。
最后,我脑洞大开,拍了个穿越剧的片段,让古代士兵用机枪战斗,并被手雷反杀的剧情:
讲真,这段视频中,Seedance 2.0 在多图控制上的优势体现了出来,虽说还有小 BUG,但已经比较完整地体现了整个剧情。
相较之下,可灵的效果则很不尽人意,尽管上传了相同的配图,但人物还是出现了严重的变形,并且士兵扫射的方向也完全搞反了。
以上展示的片段,只是我在试用过程中,做出的真正 " 能看 " 的成果。
而相当一部分的时间、积分和算力,都消耗在了 " 抽卡 " 上。
可灵的会员是 60 块钱一个月,送 1800 积分。生成一段 15 秒视频,消耗 180 积分,也就是一个月大约 10 个视频。
但问题是,"抽卡 " 是不保证质量的。你可能生成十段,只有两段勉强能用。
那天下午,我把半个月的积分都挥霍完了,最后只得到两三个勉强满意的视频——离可直接交付的影视级标准,还差得远。
为了提高成功率,我开始尝试多图控制——就是先让 AI 画几张关键帧的图,再让视频模型参考这些图生成视频。
但很快我又撞上了另一堵墙:AI 绘图本身也需要抽卡。
我让 AI 画一张 " 窗外正在下雨的咖啡馆 ",它要么把雨画在咖啡馆里,要么把窗户画成透明的墙壁。
更痛苦的是,由于最近 Seedance 2.0 爆火,字节服务器似乎压力颇大,在我测试时,一段 15 秒的视频,居然提示要排 6 个小时的队,这直接劝退了我后续的制作。

我原本以为,AI 工具能帮我省掉那些最昂贵的、消耗时间的环节——找场地、搭景、调灯光、等演员。但现在呢?场地不用找了,但我得花七个小时排队;灯光不用调了,但我得花一下午抽卡赌运气。
就这样,整整一个下午,我大部分时间都耗在了排队和抽卡里。
02
那天下午折腾完之后,我并没有觉得愤怒。更多的是一种奇怪的疲倦——不是因为做了太多事,而是因为什么事都没做成,却已经很累了。
这种感觉从哪里来的?我试着把它拆开来看。
做视频这件事,不管用什么工具,本质上都有无形的、琐屑的步骤在消耗你——传统拍摄有传统拍摄的消耗:找场地、约演员、搭景、调光、返工等等。
这样的消耗,正是视频制作环节中的 " 摩擦力 "。
AI 工具出现之前,这些摩擦力是 " 可见 " 的:你知道找场地要花多少钱,知道约演员要等多久。它们明码标价,你可以算账、预判、接受。
AI 工具出现之后呢?乍一看,那些摩擦力消失了。不用找场地了,不用约演员了。但那天下午的经历告诉我:它们并没有消失,只是换了一副面孔。
显性摩擦力,变成了排队时间和生成费用。Seedance 2.0 服务器爆掉的那七个小时,时间是真实消耗的。可灵的积分消耗是另一种形式的钱:生成一段 15 秒视频要耗掉 180 积分,效果不理想不会退给你。你付的是 " 可能 " 的钱,不是 " 确定 " 的钱。

上游摩擦力,从 " 找演员 " 变成了 " 生成参考图 "。 为了让视频效果更可控,需要先用 AI 绘图生成关键帧。但 AI 绘图本身也有摩擦力——你让它画一张窗外在下雨的咖啡馆,它可能把雨画进咖啡馆里——目前某些最 " 先进 " 的绘图模型,现在仍然在犯这种低级错误。
这就是我那天撞上的 " 控制悖论 ":为了降低视频生成的摩擦力,你需要先承受图像生成的摩擦力。摩擦力没有消失,它只是被推到了上游。
更麻烦的是,这种变形让摩擦力从 " 可见 " 变成 " 隐形 ",从 " 指导 - 改进 " 变成 " 混沌 - 靠运气 "。传统拍摄的摩擦力是一锤子买卖:场地租了、演员付了,后面就是拍。AI 工具的摩擦力是持续性的:每一次生成都有失败的可能,你永远不知道这次要花多少钱、多长时间。
当摩擦力是可见的,人会本能地去对抗它。但当摩擦力变成隐形的,人就会陷入一种莫名的消耗——不知道在哪里出了问题,只知道结果不尽如人意。
这不是 AI 工具不好,这是摩擦力在换了一副面孔之后,更难被察觉,也更难被抵消。
03
但我必须说公道话。那天的失败经历是真实的,但它不是全部的真相。
2025 年末,一部叫《斩仙台 AI 真人版》的短剧,6 天内播放量破亿。制作方 12 人团队,周期 30 天,算力成本 10 万元。同等体量的传统短剧需要 40 到 60 人,成本 60 万以上,另一个案例就是《霍去病》,23 分钟,算力成本据说是 3000 元,播放量据称有 5 亿。
同样的工具,为什么结果差距这么大?
答案其实不复杂。这就是杠杆原理:杠杆能省力,前提是支点位置正确。

逻辑很简单:AI 做特效,真人演文戏,最后剪辑合成。传统短剧做不起特效,是因为 S 级别特效单分钟成本要 1.5 万到 4 万元。但 AI 生成的特效,单分钟成本已经压缩到 1300 元,最低能到 400 元,这不是一个数量级的差距。
AI 让短剧 " 用得起特效了 " ——这才是这个工具的核心价值。不是替代人,而是把过去 " 负担不起 " 的部分,变成 " 负担得起 "。
这个逻辑,用杠杆来理解再贴切不过了:AI 是杠杆的一端,真人制作是另一端,特效镜头是支点。 把 AI 放在特效这个支点上,它以最小的成本撬动了过去需要大量金钱才能实现的画面效果。
市场印证了这一点。2025 年被称为 "AI 漫剧元年 ",全年播放量突破 700 亿,上线漫剧 46931 部。约 60% 到 70% 的漫剧使用 AI 辅助生成,但纯 AI 生成占比不到 10% ——这说明,市场不是在用 AI 替代人,而是在用 AI 做人做不了的部分。
但这里有一个前提:这个杠杆效应,是有条件的。
《斩仙台》能做到那个效果,是因为 12 人团队已经跑通了 "AI+ 真人缝合 " 的完整工作流——前期 AI 生成角色形象和场景概念图,中期真人演员拍摄文戏,后期 AI 生成特效镜头,人工剪辑合成。每个环节都有人负责,每个人都知道自己该做什么,容错空间可以被分摊到整个流程里。
所以,AI 视频工具并没有 " 降低门槛 "。更准确的表述是:它把门槛从 " 有没有资源 " 变成了 " 有没有工作流 "。
你不再需要 60 个人和 60 万块钱,但你需要一套成熟的分工体系,学会 " 缝合 "。这个认知本身,就是一道新的门槛。
04
现在回到那两个工具本身,以及它们背后的两家公司。
Seedance 和可灵虽然亮眼,但目前仍掩盖不了字节、快手在 AI 创作应用商业闭环上的焦虑。
2025 年可灵 AI 全年收入约 10 亿人民币(1.4 亿美元),2025 年全年 Capex(资本性开支)指引上调至 140 亿元,主要用于可灵 AI 和广告技术,10 亿收入 vs 140 亿投入,可灵的收入连投入的零头都不到。
字节这边,更是无从对照:字节 2025 年整体 AI 资本开支 1500 亿元,2026 年计划 1600 亿元,Seedance 至今没有公开的商业化营收数字;
所以,对二者来说,短剧和漫剧真的是 " 救命稻草 " 吗?
我的判断是:不是。
因为 AI 漫剧、短剧有几个结构性隐患。
首先,爆款难以复制,且用户审美疲劳极快。2026 年数据显示,AI 漫剧的爆款率已经下滑到 1% —— 100 部里只有 1 部能真正出圈。这个比例还在下降,因为供给在爆炸式增长,仅 2025 年抖音端原生漫剧上线数量就突破了 6 万部。

一个广告视频可能被 100 万人看,也可能被 1 万人看,但企业关心的是转化率和 ROI。
所以,更大的战场在别处。电商广告领域,AI 混剪素材制作成本降低 95%,视频产量提升 700%。品牌营销、文旅、教育、游戏,这些场景对视频的需求量远大于短剧。
现阶段快手和字节烧的钱,实际上是在为两三年后的广告和电商 AI 化买票——短剧、漫剧只是验证工具能力的试验田,不是终局。
这个大盘子有多大?2025 年中国互联网营销市场规模约 8818 亿元,移动广告市场约 4867 亿元。AI 视频哪怕只渗透其中 5%,就是 400 亿以上的市场。这会是快手和字节开辟的新市场,而不只是短剧。
更进一步地说,如果 Seedance、可灵能成为行业标准工具,未来的变现空间就不止是短剧和广告素材,而是所有需要视频内容的场景——包括游戏、影视、教育、企业服务。
但二者面临同一个核心挑战:如何把摩擦力降到用户感知不到的程度。
可灵的抽卡机制、Seedance 的排队问题,本质上都是视频生成中的 " 摩擦力 " 问题。
AI 视频创作的未来,不是让一个人变成一个团队,而是让工具变成一种能力,稳定、可控、可预期,随手可调用。当摩擦力从 " 看不见的负担 " 变成 " 感知不到的存在 ",就意味着 AI 创作能力、算力成本被摊薄到基础设施使用成本的地步。
我不敢想象那会是何等的情景,是人创造力被极大释放,还是会活在 " 黑镜 " 之中。
那真会是非常充满戏剧性张力的一幕。