文 | 极客电影,作者 | 子路,编辑 | 佛耶戈
前段时间,米哈游创始人蔡浩宇悄悄整了个大活儿。
他 2024 年创立的 AI 公司Anuttacon上线了 LPM1.0 模型,专攻AI 角色表演,用于 AI 叙事游戏《星之低语》的用户交互,官网介绍颇见野心:
人类对话是一种表演——不仅是语言,更是节奏、注视、停顿,和无数让交互鲜活的微表情。
模型没有开源,官网放出了一些 AI 生成视频示例,AI 演员的悲伤、犹豫、恐惧、放松等情绪都很到位,一度引起 AI 影像行业的轩然大波。真人演员,真的要被 AI 代替了?

可不过短短一个月,蔡浩宇亲手叫停了 LPM1.0 整个开发团队,认为 " 这个模型有点蠢 ",对于游戏来说,交互表演能力只是鸡肋,不如去开发更强的 Agent。

表演能力只是鸡肋吗?影视行业可不这么认为。
耀客官宣签约 AI 演员、恒星引力与 MiniMax 达成战略合作,正午阳光、柠萌、华策等老牌头部影视公司开始高薪聘请 AI 制片、AI 架构师、AI 运营等职位。面对可能千万级的降本增效,没有公司会不心动。

所以这次,我们特别测评了Seedance 2.0(以下简称 SD2)、可灵、快乐马(阿里旗下 HappyHorse)三大号称表演能力较强的头部 AI 模型,看究竟哪个模型走在了时代前列,能跟昙花一现的 LPM1.0 表演力掰掰手腕。
(免责声明:本期测试清新无广,为保证公平,我们每个镜头使用同样的参考图与符合模型特性的提示词,单个镜头抽卡 2-4 次。如果某个模型就是不给面子、不可控,那也别怪我 ?)
01 单一情绪测试:悲伤、愤怒、说谎、紧张……
如果只是纯测喜怒哀乐这种外放情绪,AI 生成其实不难。但影视级表演不是孤立的,更重要是一段对话、一段关系里的反应镜头。
所以我们原创了一支 AI 短片《最后的证词》,设计多人关系里的连续剧情,每个角色需要在同一事件中做出不同反应,测试5 种类型人物对应剧情里的情绪,包括眼神怀疑等细节表演。

先看故事背景:
三个月前,一家大型集团发生安全事故,官方结论是 " 操作失误 "。集团调查顾问沈知微(女主,前调查记者)怀疑这不是意外,与线人唐眠一起展开调查。
19 日晚,唐眠带着一份要交给调查委员会的关键证词走进办公楼。这份证词可以证明:事故不是意外,而是有人提前知道风险,却选择隐瞒。
随后,唐眠死亡,随身携带的关键证词失踪。失联之前,她向沈知微发送了一封邮件。
这段圆桌戏发生在隔天上午,调查委员会负责人顾明岚召集与唐眠有关的 4 个人进入问询室,当面对峙。每个人各怀鬼胎,像极了一场剧本杀。
再看每个人物在不同 AI 模型里的表演效果:
1 号:顾明岚,权力型中年女性,出场宣布 " 唐眠死了 " 的消息。我需要她表现出对现场所有人的怀疑、强大气场与压迫感。
SD2 第四条表现最好,角色从落座到左右审视、面容冷峻、侧视观察,眼神足够有力,能够表现出上位者的压迫气质。

第二条纯从表演角度来看也不错,角色眼神里有犹豫、不忍,左右环顾不是审视,更像是寻求一些精神支点。但这条情绪太柔软,不符合需求,pass。


快乐马第三条效果比较好,分镜与 SD2 类似,也准确表现出了角色的沉稳与压迫感。
(到此刻我还挺开心,AI 模型确实在表演上有眼神戏了,很棒!没有意识到快乐马即将如何制裁我)

2 号:沈知微,她是和唐眠关系最密切的朋友,得知死讯,她的第一反应是震惊、悲伤、痛苦,但还需要压抑情绪,强打精神为朋友做好最后的追问。
我把沈知微流泪和擦泪两个镜头剪在一起,大家可以看看这个情绪转化。
SD2 对指令理解比较准确,我们特别尝试做了个希区柯克变焦、一滴眼泪顺势落下,强化角色遭遇的巨大冲击与悲伤。
后续擦泪的动作也很准确,手指、眼泪、脸部皮肤不同材质的交互自然不出戏。同时兼顾了手机光照在下半张脸的光线变化,基本是可以直接用的程度。

擦泪镜头就好很多,角色有眼神的游移,用手背揉鼻子、顺势抹掉眼泪的动作比手指直接擦泪更加自然。

她刚刚听到过 " 唐眠死了 " 的消息。她不能哭,也不能在房间里崩溃。表演必须非常克制:眼神短暂失焦,瞳孔微微震动,嘴角轻轻绷住,鼻翼有极轻微的呼吸变化,下颌轻微收紧,眼眶有湿意但眼泪不能落下。她强行把情绪压回去,脸上没有明显大动作。
谁让你在这儿演嘴角抽搐了????
擦泪镜头比较刻意咱先不说,问题是手背擦过右脸,这行眼泪完全没有被抹掉,这就是典型的材质交互没有被识别。

这是一个情绪爆发型男角色,他意识到自己被伪造的门禁记录栽赃陷害,情绪从众人怀疑他的惊讶转向愤怒爆发。
SD2 情绪表现度非常好,它理解了对角色侧面到正面的镜头切换,侧面展现角色牙关紧咬的压抑怒火;正面随着镜头推进,角色有自然的手部动作配合;言辞逐渐激烈,咽喉、面中、眉头肌肉跳动都是对的。
但你仔细看正面镜头,SD2 莫名其妙在画面右侧多生成了一个人……这条能用,但只能拉大画面裁掉瑕疵

只有最后角色眼神往右看错了,按照我给到的人物位置图,他右边根本就没人,不知道最后在瞪谁。


4 号:林叙白,项目副总监,他声称只短暂见过唐眠一面、没注意过证词文件袋,但实际上,他才是拿走文件袋的那个关键人物。
这是一个看似温和儒雅的谎言型角色,对上面愤怒的 3 号周砚廷形成对照组,面对质问不慌不忙,但一些小动作泄露了他在说谎。
SD2 也出现了场景位移的问题,把 2 号从角色左侧扔到主位。表演还算在线,用典型的心理学谎言行为 " 摸鼻子 ",表现角色的回避与谎言。

问题还是之前说过的,一旦涉及到多人会议场景就智商下线,干脆把 2 号分裂成左侧和主位两个人。只能说切分下镜头勉强能用,凑合着吧还能离咋地。


这是个普通人角色,他看到了关键信息但不敢说,需要表现出紧张、犹豫、惊慌等生活化的被动情绪。
这是全片我最喜欢的一段表演,2 号的引导、质问,与 5 号的怯懦、慌张形成了鲜明对比,几个 AI 模型都完成得比较不错。
这段双人对话包括 4 句台词,只有 SD2 完整生成出来了,所以这段我决定放视频给大家感受一下 想要的角色情绪都非常准确。
可灵也还不错,给角色找到了紧张摆弄钥匙这个行为抓手,他被质问后心里揣着秘密的紧张感也能准确感知。


02 看看成片:单月狂揽 10 亿的 SD2 确实能打
看完静音版单个镜头,来联系上下文一起看看完整成片。
我们没有添加特别的包装,只筛选单一模型生成的镜头进行合理化剪辑,添加了同样的紧张氛围 BGM,尽力呈现一段完整故事。
注意,三支短片里的配音都是对应 AI 模型直接生成的。测 AI 表演能力,台词也是很重要的组成部分。
这几天有消息称,SD2 单月可为字节旗下火山引擎带来超过 10 亿元收入,并且仍在爬升期。完整测试全部镜头并且看完成片,我确实能感受到 SD2 为什么能在国内外 AI 模型市场呈现几乎垄断的姿态。
口型基本完全准确;通过提示词能相对准确理解角色站位关系;能够呈现角色需要的微表情、情绪;对于专业 AI 创作者来讲,除非特别纠结于某个镜头,整体抽卡率大概在 30%-50%。
有时候还能给点惊喜,比如林叙白回答质询这段,涉及到全景、中景、近景、特写、正反打,角色的面部朝向都是对的。最后甚至给了个从林叙白到沈知微的焦点转移。


优势在画质,同样是 1080P,可灵生成的角色皮肤细节、光影效果都能强出一截。在表演上,表情也是基本可用的,偶尔也会给到体现真实细节的惊喜镜头。
并且积分实惠,在 LibTV 上的 15 秒 1080P 视频,可灵消耗积分是 SD2 的 58% 左右。
但劣势就在口型,声画直出的视频大部分做不到口型一致,角色一长时间说话就容易露馅儿,最好是给到一个后期配音。
跟前两者相比,快乐马出这条片子我只能说是" 拉完了 "。
表演上没惊喜,在一堆废片里挑挑拣拣选出来这么一些镜头能勉强组装。角色一致性几乎做不到,在同一个场景里角色的脸都能换来换去。
场景一致性方面干脆做梦,就算给了首帧图做参考,也还是非常不稳定,角色像是 " 梦到哪里坐哪里 ",当个搞笑片看看吧。
03 意想不到的 BUGAI 能不能别耍我了
最后给大家看点好玩的。
这期内容我们前后做了半个月,大部分时间都耗在反复抽卡上,不是自己上手做视频可能想象不到,AI 能生成这么多意想不到的 BUG。
简单的比如生成画面里的文字乱码,尤其中文,快乐马生成涉及到手机桌面、邮件内容等文字部分就没有一个是正确的。

复杂点的我分了几类:
第一类:换脸换换换换到崩溃
(快乐马)拉开椅子是坐主位的女性,切个镜头变成在桌子旁边坐下的男性,长发嗖一下变短了,再切镜又变成中年女性……姐妹你到底是谁?

(可灵)偶尔也会有角色识别错误的毛病,演技挺好,但你们能想到男人的台词声音从一个女性角色嘴里说出来这件事有多离谱吗 ?
第二类:迷之位移
如果只是角色左右位置识别错误、镜头翻转这些小瑕疵,我也不会过多苛责,但(SD2)你个浓眉大眼的,把座位上的角色突然弹射到屏幕前是什么意思?

(可灵)偶尔也会超出想象,这里需要顾明岚把平板电脑推到周砚廷面前,好家伙一眨眼她把我的道具三视图整个推过来嘞!

当然论整活还得是(快乐马),至今没懂它是怎么把角色拦腰斩断然后浮在桌面上的。

第三类:神奇的语言系统
有时会生成一段听不懂的语言,或者突然变成英语对白、台湾腔,这主要因为可灵暂时不支持声音参考,可以说是声画同出不够可控,也可以说是为后期专业配音留出空间。
总体来讲,虽然过程中遭遇了一些 AI 模型不可控带来的 " 折磨 ",但测试结果仍然有震惊到我。
在专业 AI 导演的提示词下,或许我们可以暴言:AI 演员的表演能力,或许已经超越了市面上 50% 的真人演员。
当然,如果我们想追求《甜蜜蜜》里张曼玉那一滴笑中带泪、《漫长的季节》里范伟的 " 往前看、别回头 " 等神级演技,AI 做不到。


但是 " 二番以下演员将被 AI 代替 ",可能很快就不再只是一句传言。