APP下载

关于ZAKER

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

Skills 合作

钛媒体 24分钟前

米哈游创始人放弃的 AI 表演，Seedance2.0、可灵、快乐马谁能成？

文 | 极客电影，作者 | 子路，编辑 | 佛耶戈

前段时间，米哈游创始人蔡浩宇悄悄整了个大活儿。

他 2024 年创立的 AI 公司Anuttacon上线了 LPM1.0 模型，专攻AI 角色表演，用于 AI 叙事游戏《星之低语》的用户交互，官网介绍颇见野心：

人类对话是一种表演——不仅是语言，更是节奏、注视、停顿，和无数让交互鲜活的微表情。

模型没有开源，官网放出了一些 AI 生成视频示例，AI 演员的悲伤、犹豫、恐惧、放松等情绪都很到位，一度引起 AI 影像行业的轩然大波。真人演员，真的要被 AI 代替了？

LPM1.0 模型 AI 角色表演示例

可不过短短一个月，蔡浩宇亲手叫停了 LPM1.0 整个开发团队，认为 " 这个模型有点蠢 "，对于游戏来说，交互表演能力只是鸡肋，不如去开发更强的 Agent。

表演能力只是鸡肋吗？影视行业可不这么认为。

耀客官宣签约 AI 演员、恒星引力与 MiniMax 达成战略合作，正午阳光、柠萌、华策等老牌头部影视公司开始高薪聘请 AI 制片、AI 架构师、AI 运营等职位。面对可能千万级的降本增效，没有公司会不心动。

也许就像《牌子》导演 DIDI-OK 预测的，解决 AI 演员长时间的表演能力会成为下个 AI 时代的拐点。我觉得，这也会彻底改写当下影视行业的格局。

所以这次，我们特别测评了Seedance 2.0（以下简称 SD2）、可灵、快乐马（阿里旗下 HappyHorse）三大号称表演能力较强的头部 AI 模型，看究竟哪个模型走在了时代前列，能跟昙花一现的 LPM1.0 表演力掰掰手腕。

（免责声明：本期测试清新无广，为保证公平，我们每个镜头使用同样的参考图与符合模型特性的提示词，单个镜头抽卡 2-4 次。如果某个模型就是不给面子、不可控，那也别怪我 ?）

01 单一情绪测试：悲伤、愤怒、说谎、紧张……

如果只是纯测喜怒哀乐这种外放情绪，AI 生成其实不难。但影视级表演不是孤立的，更重要是一段对话、一段关系里的反应镜头。

所以我们原创了一支 AI 短片《最后的证词》，设计多人关系里的连续剧情，每个角色需要在同一事件中做出不同反应，测试5 种类型人物对应剧情里的情绪，包括眼神怀疑等细节表演。

位置关系参考图

先看故事背景：

三个月前，一家大型集团发生安全事故，官方结论是 " 操作失误 "。集团调查顾问沈知微（女主，前调查记者）怀疑这不是意外，与线人唐眠一起展开调查。

19 日晚，唐眠带着一份要交给调查委员会的关键证词走进办公楼。这份证词可以证明：事故不是意外，而是有人提前知道风险，却选择隐瞒。

随后，唐眠死亡，随身携带的关键证词失踪。失联之前，她向沈知微发送了一封邮件。

这段圆桌戏发生在隔天上午，调查委员会负责人顾明岚召集与唐眠有关的 4 个人进入问询室，当面对峙。每个人各怀鬼胎，像极了一场剧本杀。

再看每个人物在不同 AI 模型里的表演效果：

1 号：顾明岚，权力型中年女性，出场宣布 " 唐眠死了 " 的消息。我需要她表现出对现场所有人的怀疑、强大气场与压迫感。

SD2 第四条表现最好，角色从落座到左右审视、面容冷峻、侧视观察，眼神足够有力，能够表现出上位者的压迫气质。

Seedance 2.0 生成

第二条纯从表演角度来看也不错，角色眼神里有犹豫、不忍，左右环顾不是审视，更像是寻求一些精神支点。但这条情绪太柔软，不符合需求，pass。

可灵表演出了一种急躁的中年高管状态，主角快速落座、叹气，眼神看天、宣布死讯，然后迅速盯视自己最怀疑的对象。

可灵生成

快乐马第三条效果比较好，分镜与 SD2 类似，也准确表现出了角色的沉稳与压迫感。

（到此刻我还挺开心，AI 模型确实在表演上有眼神戏了，很棒！没有意识到快乐马即将如何制裁我）

快乐马生成

2 号：沈知微，她是和唐眠关系最密切的朋友，得知死讯，她的第一反应是震惊、悲伤、痛苦，但还需要压抑情绪，强打精神为朋友做好最后的追问。

我把沈知微流泪和擦泪两个镜头剪在一起，大家可以看看这个情绪转化。

SD2 对指令理解比较准确，我们特别尝试做了个希区柯克变焦、一滴眼泪顺势落下，强化角色遭遇的巨大冲击与悲伤。

后续擦泪的动作也很准确，手指、眼泪、脸部皮肤不同材质的交互自然不出戏。同时兼顾了手机光照在下半张脸的光线变化，基本是可以直接用的程度。

可灵生成的人物特写画质非常好，没有 AI 常见刻意崎岖化的油腻感。但放在这里情绪相对没那么准确，它对 " 情绪压抑 " 的处理导致角色反应过于冷静。

擦泪镜头就好很多，角色有眼神的游移，用手背揉鼻子、顺势抹掉眼泪的动作比手指直接擦泪更加自然。

快乐马！它生动展示了一个不会演戏的资源咖被塞进剧组是什么车祸现场。得知好朋友去世了，角色嘴角的抽搐是什么意思？我的提示词是：

她刚刚听到过 " 唐眠死了 " 的消息。她不能哭，也不能在房间里崩溃。表演必须非常克制：眼神短暂失焦，瞳孔微微震动，嘴角轻轻绷住，鼻翼有极轻微的呼吸变化，下颌轻微收紧，眼眶有湿意但眼泪不能落下。她强行把情绪压回去，脸上没有明显大动作。

谁让你在这儿演嘴角抽搐了？？？?

擦泪镜头比较刻意咱先不说，问题是手背擦过右脸，这行眼泪完全没有被抹掉，这就是典型的材质交互没有被识别。

3 号：周砚廷，数据系统负责人，按照门禁记录，他在前一晚 23:02 打开过档案室，被证据指向是最后一个接触死者唐眠的人。

这是一个情绪爆发型男角色，他意识到自己被伪造的门禁记录栽赃陷害，情绪从众人怀疑他的惊讶转向愤怒爆发。

SD2 情绪表现度非常好，它理解了对角色侧面到正面的镜头切换，侧面展现角色牙关紧咬的压抑怒火；正面随着镜头推进，角色有自然的手部动作配合；言辞逐渐激烈，咽喉、面中、眉头肌肉跳动都是对的。

但你仔细看正面镜头，SD2 莫名其妙在画面右侧多生成了一个人……这条能用，但只能拉大画面裁掉瑕疵

可灵没有做切镜，但敢于用近景，角色从抬眼、质问，面部表情随着说话声音放大的顿挫感，到最后情绪爆发、面部纹路的走向，都很到位。

只有最后角色眼神往右看错了，按照我给到的人物位置图，他右边根本就没人，不知道最后在瞪谁。

快乐马角色情绪是三家里最激烈的，愤怒原地干拔，法令纹随着口型起伏，这也代表了一种市面上的表演流派。

但这家伙把我的场景全部换掉了……一下子把角色从会议室扔到审讯室。问题是，我甚至给了首帧作为参考图，这都识别不出来？

给快乐马的首帧参考图，别家不一定有这待遇

4 号：林叙白，项目副总监，他声称只短暂见过唐眠一面、没注意过证词文件袋，但实际上，他才是拿走文件袋的那个关键人物。

这是一个看似温和儒雅的谎言型角色，对上面愤怒的 3 号周砚廷形成对照组，面对质问不慌不忙，但一些小动作泄露了他在说谎。

SD2 也出现了场景位移的问题，把 2 号从角色左侧扔到主位。表演还算在线，用典型的心理学谎言行为 " 摸鼻子 "，表现角色的回避与谎言。

可灵则是用扶眼镜的方式表现谎言，它这条表演更细节，角色被 2 号质问后有一个明显的眼神回避。

问题还是之前说过的，一旦涉及到多人会议场景就智商下线，干脆把 2 号分裂成左侧和主位两个人。只能说切分下镜头勉强能用，凑合着吧还能离咋地。

快乐马这段先强化了角色的温和淡定，被 2 号戳破之后则回避视线，同步做了摸鼻子、推眼镜的心虚动作。

5 号：何平，夜班保安，他是关键的NPC 目击者，前一晚撞见过唐眠，也看到了一个人影拿着黑色文件袋离开。

这是个普通人角色，他看到了关键信息但不敢说，需要表现出紧张、犹豫、惊慌等生活化的被动情绪。

这是全片我最喜欢的一段表演，2 号的引导、质问，与 5 号的怯懦、慌张形成了鲜明对比，几个 AI 模型都完成得比较不错。

这段双人对话包括 4 句台词，只有 SD2 完整生成出来了，所以这段我决定放视频给大家感受一下想要的角色情绪都非常准确。

可灵也还不错，给角色找到了紧张摆弄钥匙这个行为抓手，他被质问后心里揣着秘密的紧张感也能准确感知。

快乐马细节上没前两者那么丰富，给了角色更多直视质问者的镜头，显得他太有底气，勉强可用但不够准确。

总体测完，我认为现有的 AI 模型真人画风表演能力是超预期的，细微表情、反应镜头已经比较成熟，不需要成百上千次抽卡就能实现 " 以假乱真 "。

02 看看成片：单月狂揽 10 亿的 SD2 确实能打

看完静音版单个镜头，来联系上下文一起看看完整成片。

我们没有添加特别的包装，只筛选单一模型生成的镜头进行合理化剪辑，添加了同样的紧张氛围 BGM，尽力呈现一段完整故事。

注意，三支短片里的配音都是对应 AI 模型直接生成的。测 AI 表演能力，台词也是很重要的组成部分。

这几天有消息称，SD2 单月可为字节旗下火山引擎带来超过 10 亿元收入，并且仍在爬升期。完整测试全部镜头并且看完成片，我确实能感受到 SD2 为什么能在国内外 AI 模型市场呈现几乎垄断的姿态。

口型基本完全准确；通过提示词能相对准确理解角色站位关系；能够呈现角色需要的微表情、情绪；对于专业 AI 创作者来讲，除非特别纠结于某个镜头，整体抽卡率大概在 30%-50%。

有时候还能给点惊喜，比如林叙白回答质询这段，涉及到全景、中景、近景、特写、正反打，角色的面部朝向都是对的。最后甚至给了个从林叙白到沈知微的焦点转移。

可灵版正片我能给到一个" 人上人 "，优劣势都很突出。

优势在画质，同样是 1080P，可灵生成的角色皮肤细节、光影效果都能强出一截。在表演上，表情也是基本可用的，偶尔也会给到体现真实细节的惊喜镜头。

并且积分实惠，在 LibTV 上的 15 秒 1080P 视频，可灵消耗积分是 SD2 的 58% 左右。

但劣势就在口型，声画直出的视频大部分做不到口型一致，角色一长时间说话就容易露馅儿，最好是给到一个后期配音。

跟前两者相比，快乐马出这条片子我只能说是" 拉完了 "。

表演上没惊喜，在一堆废片里挑挑拣拣选出来这么一些镜头能勉强组装。角色一致性几乎做不到，在同一个场景里角色的脸都能换来换去。

场景一致性方面干脆做梦，就算给了首帧图做参考，也还是非常不稳定，角色像是 " 梦到哪里坐哪里 "，当个搞笑片看看吧。

03 意想不到的 BUGAI 能不能别耍我了

最后给大家看点好玩的。

这期内容我们前后做了半个月，大部分时间都耗在反复抽卡上，不是自己上手做视频可能想象不到，AI 能生成这么多意想不到的 BUG。

简单的比如生成画面里的文字乱码，尤其中文，快乐马生成涉及到手机桌面、邮件内容等文字部分就没有一个是正确的。

复杂点的我分了几类：

第一类：换脸换换换换到崩溃

（快乐马）拉开椅子是坐主位的女性，切个镜头变成在桌子旁边坐下的男性，长发嗖一下变短了，再切镜又变成中年女性……姐妹你到底是谁？

（可灵）偶尔也会有角色识别错误的毛病，演技挺好，但你们能想到男人的台词声音从一个女性角色嘴里说出来这件事有多离谱吗 ?

第二类：迷之位移

如果只是角色左右位置识别错误、镜头翻转这些小瑕疵，我也不会过多苛责，但（SD2）你个浓眉大眼的，把座位上的角色突然弹射到屏幕前是什么意思？

（可灵）偶尔也会超出想象，这里需要顾明岚把平板电脑推到周砚廷面前，好家伙一眨眼她把我的道具三视图整个推过来嘞！

当然论整活还得是（快乐马），至今没懂它是怎么把角色拦腰斩断然后浮在桌面上的。

第三类：神奇的语言系统

有时会生成一段听不懂的语言，或者突然变成英语对白、台湾腔，这主要因为可灵暂时不支持声音参考，可以说是声画同出不够可控，也可以说是为后期专业配音留出空间。

总体来讲，虽然过程中遭遇了一些 AI 模型不可控带来的 " 折磨 "，但测试结果仍然有震惊到我。

在专业 AI 导演的提示词下，或许我们可以暴言：AI 演员的表演能力，或许已经超越了市面上 50% 的真人演员。

当然，如果我们想追求《甜蜜蜜》里张曼玉那一滴笑中带泪、《漫长的季节》里范伟的 " 往前看、别回头 " 等神级演技，AI 做不到。

但是 " 二番以下演员将被 AI 代替 "，可能很快就不再只是一句传言。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai

相关阅读

英伟达与LG集团合建AI工厂，合作推进机器人、自动驾驶及自主AI

36氪 37分钟前

搭上优必选？家居零售龙头直线涨停，居然智家回应

21世纪经济报道 11分钟前

仙工智能IPO通过聆讯，“机器人大脑第一股”成色几何？

钛媒体 20分钟前

小米手机版龙虾！Xiaomi miclaw封测招募小米17 Max、REDMI K90 Max

快科技 1小时前

年入30亿：泰兰尼斯与国产童鞋的「中场战事」

钛媒体 53分钟前

HBM堆到20层热炸了！SK海力士、三星、美光打响芯片内部散热战

快科技 1小时前

内存也玩显示屏！V-Color推OLED DDR5：最高速度6000MT/s

快科技 1小时前

人类首次成为网络少数派：赢家输家清单与组织重构指南

钛媒体 53分钟前

英伟达推出全模态物理AI模型，机器人ETF银华（562360）等机器人ETF盘中逆市涨超1%

21世纪经济报道 1小时前

iPhone 18 Pro Max全版本电池突破5000mAh：美版容量更是刷新苹果纪录

快科技 2小时前

豆包想赚钱，要先Codex化

钛媒体 2小时前

英伟达与SK海力士宣布多年期技术合作全球首个“预制算力中心底座”正式投用

财联社 4小时前

小米电视出货量连续增长：国内市占率22.1%！

快科技 3小时前

算力引爆MLCC超级周期，“电子工业大米”或结构性缺货

36氪 4小时前

本周 AI 项目推荐：Seele、喵吉托、SodaGame......AI游戏产品不再迷恋“一句话生成”

硅星人 3小时前

最新评论

没有更多评论了

钛媒体

订阅

觉得文章不错，微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容

Blockchain News