
与此同时,Seedance 2.0 参与制作的另外 8 部 AI 影片也在电影节期间展映。其中,视频 AI 平台 Higgsfield 基于 Seedance 2.0 打造的全球首部 95 分钟 AI 电影《Hell Grind》,在戛纳完成了全球首映。
从互联网平台到国际电影节的 " 秀场 ",AI 短剧以盛大之势迅速进入主流视野,走出了不同于传统影视的进阶之路。当工具端的使用不再成为门槛,内容生产的基准线整体抬升,行业正在寻找下一个发展锚点:如何让 AI 真正讲出市场愿意为之买单的好故事?
AI 视频 " 卖铲人 " 接连完成大额融资
过去数月,AI 视频生成赛道的融资消息接连不断,并频频传出冲刺 IPO 的消息。
今年 3 月,AI 视频生成企业爱诗科技宣布完成 3 亿美元 C 轮融资,由鼎晖投资旗下多支基金联合领投,产业投资人中国儒意、三七互娱等近 20 家机构参投,刷新了亚洲 AI 视频生成领域的最大单次融资纪录。此轮融资后,爱诗科技估值达到 10 亿美元。
紧随其后,多模态赛道另一企业生数科技宣布完成近 20 亿元人民币 B 轮融资,由阿里云领投,中网投、好未来、光合创投等战略跟投。另据报道称,公司或最快于 2026 年上半年启动港股 IPO,本轮融资后其估值超 20 亿美元。
生成式 AI 创新企业智象未来同样动作频频。4 月中旬,公司宣布完成超 5 亿元 B 轮融资,由东方富海、安徽省产投、峰华资本等联合投资,并在此后半个月内又完成新一轮亿级融资。
今年 5 月,快手被曝计划将旗下视频生成大模型业务可灵 AI 分拆出来,以 200 亿美元估值启动 Pre-IPO 融资,规模约 20 亿美元,并计划于 2027 年启动上市。快手随后回应称,拟议重组方案仍处于初步阶段。
" 今年视频生成模型的迭代速度确实远超预期,近期还将有一批更新的模型发布。" 有戏 AI 创始人林洪祥对记者表示。在他看来,行业进入爆发期原因有二:一是商业化路径明确,尤其是 AI 短剧率先打通了商业化闭环;二是技术发展达到关键节点,路径逐步成熟,为商业化落地奠定了基础。
从 " 生成视频 " 到 " 生成好视频 "
技术路线的演进,始终是 AI 视频赛道最核心的变量。大模型兴起前,图像生成主要依赖 GAN(生成对抗网络)与扩散模型(Diffusion)。真正的转折点来自 DiT(Diffusion Transformer)架构,它将扩散模型与 Transformer 结合,打开了高质量视频生成的大门。
目前行业主流视频厂商模型几乎都基于 DiT 架构,在共识之上,各家在技术路线和能力布局上各有侧重。四川大学网络空间安全学院党委书记雷印杰对财联社记者分析称,国内 AI 视频生成模型普遍形成了较强的技术特色和产品优势,从应用侧重点来看,可灵更偏 " 可控创作 " 路线,强调把文本、图片、视频参考统一到多模态视觉语言里,解决复杂表达和一致性问题。Seedance 更注重 " 基础模型工程化 ",强调多镜头生成、文生图生统一训练,以及后续的音视频联合生成。PixVerse 更偏 " 产品化和实时交互 ",一方面做多镜头和原生音频,另一方面已向实时世界模型方向探索。HappyHorse 从公开信息看,更强调原生多模态、音视频一体和面向广告、电商、短剧的一体化生产。
今年以来,模型迭代已从 " 能不能生成视频 " 迈入 " 能不能生成好视频 " 的新阶段。Seedance 2.0 的出现就是一个典型案例:其突出的导演级镜头理解、音画同步与匹配能力,使其在行业内一度占据主导地位,成为众多短剧公司的首选模型。随着整体能力水准提升,下一代视频生成模型将走向何处?技术路线趋向收敛还是继续分化?
" 未来视频生成模型会呈现出一种趋势:底层架构阶段性收敛,但核心能力会继续分化。" 雷印杰分析,从架构上看,扩散模型与 Transformer 结合成为主流并不是偶然。视频生成要同时处理空间细节、时间连续性、语义理解和运动变化,而 Transformer 擅长建模长程依赖,扩散模型擅长生成高质量视觉内容,所以 DiT 或类似架构在现阶段会成为比较稳定的技术底座。
他认为,未来技术路径主要有三点:第一,多模态统一输入与生成,让模型能同时理解画面、声音、运动和叙事;第二,长时序一致性,解决角色、场景、物体状态和事件因果在多镜头中的连续性;第三,可编辑、可交互、可干预,不只是生成一段视频,而是在一个动态场景中按用户意图修改和推进。
" 可控性、长视频能力和世界建模能力会成为真正的分水岭。未来有竞争力的视频模型,不只是能生成‘好看的视频’,而是能生成可修改、可复用、符合创作意图和物理逻辑的视频。" 雷印杰说。
工具井喷 " 手搓 " 智能体成热潮
与模型端的快速更迭同步,应用端的 AI 短剧创作平台也迎来爆发。
从头部互联网公司到垂直厂商,一系列智能体平台密集推出。例如,火山引擎推出一站式 AIGC 短剧创作平台 " 火山剧创 1.0",阿里云发布全链路 AI 视频创作平台 " 万镜一刻 ",360 集团推出 AI 影像生产平台 " 纳米大片流水线 "。 越来越多的短剧公司也开始开发适配自身需求的生产平台。
对于大厂而言,切入 AI 视频创作赛道,争夺的不仅是商业变现入口,更是内容生态的掌控权和生产方式的定义权。
南京呼吸间传媒科技文化有限公司 AIGC 负责人李博闻以 " 火山剧创 1.0" 和 " 万镜一刻 " 为例,向记者分析称," 火山剧创 1.0" 的核心优势是生态闭环,它背靠字节,能够将番茄小说的 IP、自家的先进模型、以及抖音的流量分发无缝整合,争夺的是从 IP 到生产再到分发的完整链条入口。而阿里云的 " 万镜一刻 ",走的是企业级基建的路线。它集成了阿里系的各种模型,特别强调故事板、智能体协作和无限画布等功能,瞄准的是品牌营销、企业视频生产这类需要团队协作和资产管理的云端工作流。
李博闻认为,平台最核心的竞争力在于能沉淀和掌控什么样的 " 生产资料 "。这远不只是素材库,而是包括角色设定、场景模板、成功的镜头语言乃至团队协作的流程和数据。一旦创作者将他的工作习惯、资产库和项目流程都迁移并沉淀在某个平台上,迁移成本会变得非常高,平台就建立了真正的用户黏性。
而对于短剧公司来说,选择 " 手搓 " 工具,更多是为了在垂类赛道精耕细作,保障内容输出的可持续性。
雪宝工作室品宣总监王天海向记者透露,目前自研平台的开发费用可控制在 10 万元以内,甚至几万元即可完成基础工具开发。他解释了自研的原因:一是确保核心素材自主可控,AI 漫剧、真人剧、2D/3D 剧的核心资产包括提示词、定妆等。自研工具可沉淀这些资产,便于内容复用和续集制作,提升内容一致性与资产复用效率。二是适配 API 调用需求,例如 Seedance 模型推出后开放了 API 接口,如果没有自研平台无法直接调用,只能通过第三方平台间接使用。三是自研工具可开放给上下游生态伙伴使用,更好服务自身生态,聚拢内容资源。
苏州画宗人工智能科技有限公司是一家 OPC(一人公司)企业,公司联合创始人王鹏告诉记者,目前标准化的短剧平台和工具能解决 大约 70%-80% 的制作需求,精品内容仍需自己开发工具精细打磨。
王鹏以团队最新打磨的智能体为例:团队将 GPT Image 2 与 Seedance 2.0 结合制作出专属工作流。以前制作片子要单独设计角色、场景、道具,再据此撰写提示词,流程繁琐且审美差异大。现在在前端设计 Agent 后,把风格、调性、分镜设计、节奏把控、构图运镜等影视专业知识都封装进去,员工只需输入剧本,即可生成专业提示词,大幅提高了工作效率。
工具层的繁荣,意味着 AI 短剧的生产已迈入标准化、工业化的轨道。然而,一个值得关注的现象是,行业日均产出已达数千甚至上万部短剧,但很多作品播放量卡在百万以下。早期简单手搓出一部 AI 短剧就能获取流量红利的日子,已经一去不复返。
在林洪祥看来,产能扩张之外,更应该回归行业的核心诉求,即如何打造爆款?他分析,从工具侧来看,行业内有不少专注短剧智能体平台的玩家,但部分仅依靠算力差价盈利,模式单一导致竞争惨烈。未来爆款打造的核心,终究依赖行业积淀与底层技术。
" 工具的普及,降低的是生产的门槛,而不是打造爆款的门槛。" 李博闻认为,未来的爆款将依赖于 " 最能系统化驾驭 AI 生产流程的团队或新型创作者 ",创作者要具备故事发现力、IP 判断力、剧本拆解力、资产管理力、分镜控制力、模型调度力、成本核算力——如何将工具有序地组织起来,这套工作流及其背后的制片思维,才是真正的核心竞争力。
生产端的平权,让内容生产不再是障碍,但好内容的竞争,或许才刚刚开始。