当 AI 开始进入手机相册、输入法、系统助手之后,最传统、也最容易被忽视的语音通话,终于也被运营商重新包装一遍了。
近日,中国移动正式上线 5G 新通话,试图把过去只负责接通的语音服务,升级成高清、智能、安全的一整套通信体验。问题是,AI 通话这件事看起来简单,真正用起来却很挑剔:语音转写准不准、AI 翻译会不会出错以及相比手机自带的功能有没有优势?
这一次,雷科技(ID:leitech)就从通话场景测试出发,看看中国移动主导的 AI 语音升级,究竟能不能带来通信体验的升级。
按照运营商的「传统艺能」,推出增值业务的直接目的往往是增收,用户要用新功能,通常得额外付费。此次中国移动上线的 5G 新通话,包含的具体功能主要有趣味通话、通话字幕、智能翻译、点亮屏幕、AI 速记。由于该服务刚刚上线,兼容性方面还在和不同机型磨合,当下能正常使用的功能主要是通话字幕、智能翻译和 AI 速记。
要使用移动的 5G 新通话服务,首先得开通相关会员,具体包括基础会员、黄金会员和钻石会员。其中,最基础的会员目前免费,套餐内包含每月 60 分钟的通话字幕、10 分钟的智能翻译和 10 分钟的 AI 速记;黄金会员则升级为不限时通话字幕、100 分钟的智能翻译和 100 分钟的 AI 速记,月费 8 元;最高一档的钻石会员通话字幕和智能翻译都是不限时,AI 速记升级到了 300 分钟,月费 15 元。

5G 新通话开通方面,现在还是有一些限制条件的:首先必须是安卓或鸿蒙机型,暂不支持 iPhone;其次手机和号卡得开通了 VoLTE 或 VoNR 服务,即支持高清语音通话,语音通话要通过流量而非传统 GSM,这也是它能接入云端 AI 服务的前提条件。
具体开通这项业务时,需要在中国移动官方 App 中进行。不过,目前这个路径还存在一个 bug,按照官方指引在 App 中以「通话升级服务」为关键词搜索,无法跳转到业务界面;但如果搜索「通话字幕」「智能翻译」等更加具体的功能关键词,则可以成功跳转。
在 5G 新通话界面的「通话设置」选项中,可以对 AI 速记、智能翻译、通话字幕等功能进行设置。比如 AI 速记可以选择具体的行业领域,像法律、科技、体育、医疗等,这就方便了特定职业工作场景下的使用;智能翻译则是可以选择语言,目前支持英语、日语和俄语三种语言和粤语一种方言;而通话字幕支持英语和日语两种外语,方言则有粤语、四川话等。


我们在一台安卓手机上开通了中国移动的 5G 新通话服务,紧接着就来实测一波,看看这些功能是不是真的好用。
通话字幕:表现一般
首先测试的就是通话字幕,说白了这个功能就是在打电话的时候把双方的语音实时转成文字。实际上,在 AI 技术普及前,语音转文字功能就在很多场景里出现了,只是转录效果通常都不太好,对说话人的口音标准程度、咬字清晰度等方面有很高的要求。
而 AI 对语音转录的助力,体现在能更精准地识别理解相对没那么标准的模糊发音,同时能根据上下文来调整和修正,以提升整体的准确度。中国移动的通话字幕功能,实现的主要难度就是「实时」,要通过云端 AI 在极短时间内给出反馈。
实际测试过程中,我们让另一名小伙伴在电话另一端念一段雷科技之前的评测稿件,然后在通话界面开启通话字幕。从结果来看,它的表现只能说有点一般,大部分字词其实都转录正确了,但一些关键词缺失或转录错了,导致语句乃至整段话变得难以理解。更关键的是,语音通话是双方实时进行的,使用者不太可能停下来自己去脑补和修正字幕的错误。

智能翻译功能可以视作通话字幕的增强版,即在把语音转成字幕的同时,提供另一条翻译字幕。我们实测时发现,如果通话端是比较标准的英文语音,则识别的准确率还是挺高的。不过,部分细节稍微有点瑕疵,比如「I'm fine,Thank you and you?」的后半句显然不能翻译成「谢谢你和你」。


AI 速记是现在很多办公、会议软件中一项非常基础的功能,它的作用基本就是把语音信息保存并转成文字,同时会对信息进行归纳总结,并整理成更简洁的摘要。相比实时字幕,AI 速记的准确率通常更高。原因在于,实时字幕更强调边说边出,系统需要在很短时间内完成识别和显示;而 AI 速记对时效性的要求没那么高,可以在通话结束后结合更完整的上下文进行整理、修正和归纳,因此更容易得到准确、连贯的结果。
我们测试时,用了一篇雷科技(ID:leitech)视频内容的音频,通话结束后,移动会发送一条 AI 速记已完成的短信,同时也会保存在云端,用户可以打开移动 App 查看或导出。

其实,在中国移动推出 5G 新通话之前,很多手机厂商已经在系统中加入了 AI 通话相关的功能。比如,现在绝大部分国产手机都有 AI 通话助手,它能将语音通话转成文字并概括核心内容,还能提供实时翻译,甚至还能直接帮用户接电话,用 AI 语音来回复对方。
这样看下来,运营商端的 AI 通话和终端厂商的 AI 通话,在具体功能方面其实有些重叠的,只是它们的实现机制有所区别。现在很多旗舰机型,都拥有一定的本地 AI 算力,像 OPPO Find X8 系列就配备了安第斯大模型端侧版,通话一结束,手机会直接调用本地 NPU 算力,在本地提取对话的关键信息并生成摘要文本,这切断了数据上云的路径,从根本上保证了商务电话等敏感信息的隐私安全。

另外,运营商和手机厂商对 AI 通话的商业化路线也很不一样。作为依靠增值业务增收的运营商,中国移动的思路很简单,就是把 AI 通话视作付费业务,用比传统通话更强的 AI 功能来吸引用户付费。
而手机厂商推出的类似功能,则普遍是免费的。也就是说,小米 OV 们的 AI 通话,并不是为了直接增收,更多是出于增强手机产品本身竞争力的考量,说到底是为了带动手机销量增长。
坦率说,对于中国移动这次推出的 5G 新通话,我个人不是特别看好。首先,现在主流手机品牌基本都提供了类似的功能,二者的使用场景是有重叠的;其次,移动这项服务的免费版有很多限制,付费机制本身就会劝退很多人;另外,5G 时代,用户对运营商提供的语音服务需求量在急剧降低,人们更习惯于用微信、QQ 等第三方 App 来代替。
当然,这并不意味着以中国移动为代表的运营商,在 AI 领域的尝试就是没意义的。AI 已经在持续改变千行百业,也对运营商提出了全新的转型要求。
客观来看,运营商的优势在于底层网络无差别的覆盖。毕竟并非所有人都在使用支持大模型的最新旗舰机,对于大量中低端手机或老旧设备用户而言,这种不吃硬件配置、完全依托网络的云端 AI 服务,恰恰是他们体验 AI 便利的最低门槛。
此外,相比于在 C 端和手机厂商内卷,B 端市场或许才是运营商 AI 通话更广阔的舞台。无论是面向政企的 AI 客服,还是跨国商务会议场景,通过打包出售定制化的 AI 通信解决方案,运营商显然更容易跑通商业变现的路子。
总的来说,中国移动的 5G 新通话更像是一次 AI 领域的试水。尽管现阶段面向普通用户的体验仍需打磨,付费模式也不一定能被广泛接受,但作为基础设施提供者,将 AI 能力直接注入通信底层,依然是通信行业迈向 AI 化所必须要走的路。
