阿里数字人技术负责人李小龙:更期待虚拟数字人“有趣的灵魂”

 邮箱网  0条评论  2655次浏览  2022年03月18日 星期五 10:18

分享到: 更多
每经记者 陈婷    

虚拟数字人(又称“虚拟人”、“数字人”),时下正“当红”。

只要在搜索引擎中输入“虚拟数字人”相关的关键词,便能看到不少相关消息,如:中央广播电视总台推出拥有超自然语音、超自然表情的超仿真主播“AI王冠”;奥飞娱乐回复投资者称将打造更多的虚拟偶像;虚拟角色开发平台Inworld AI完成1000万美元融资......

启信宝数据显示,仅2021年国内就新增虚拟数字人相关企业超6万家;投资领域更是大手笔频出,2022年开年还不到一个月,虚拟数字人领域近百起融资累计金额已经超过4亿元。

而在结束不久的北京冬奥会期间,数十家公司更是集中推出了酝酿许久的虚拟数字人,他们在不同的应用场景内“发挥所长”。冬奥宣推官“冬冬”、数字记者“小诤”、“3D虚拟冰冰”、谷爱凌数字分身“meet gu”和手语主播“聆语”……据不完全统计,冬奥会期间,有将近30个虚拟数字人集中亮相,进一步推高了虚拟数字人的热度。

某种程度上,2022年北京冬奥会,不但让许多观众记住了“谷爱凌”、“苏翊鸣”等明星运动员在冰天雪地里的矫健身姿,更成为了虚拟数字人行业发展上的分水岭。

与之前更多是创业公司推出虚拟数字人不同,在冬奥会期间亮相的这些虚拟数字人背后,不乏赫赫有名的科技大企业。

公开资料显示,“3D虚拟冰冰”是科大讯飞牵手央视后的产物,手语主播“聆语”则由腾讯云小微联合PCG AI等技术团队共同打造。而冬奥宣推官“冬冬”则是阿里推出的AI实时驱动的写实数字人。

虽说虚拟数字人“热”早已有之,但在本届冬奥会之前,这股“热潮”更多聚焦在以“颜值”见长的虚拟数字人上,如初音未来、AYAYI等,这些虚拟数字人被业内称之为“虚拟偶像”,通过“圈粉”进行流量变现。

“科技大佬”们却有着不一样的思路。这些新鲜出炉的虚拟数字人,有着全然不同的“亮点”。他们的身份不再是此前场景的虚拟偶像,而是试图去承担诸如演播室主持人、电商直播间带货主播等更为多元化的职能。以阿里推出的虚拟数字人冬冬为例,冬冬的突破之处在于,实现了拟真人的实时交互能力。

为了深入了解虚拟人的普及情况,值此315之际,《每日经济新闻》联合科创板首家数据分析提供商慧辰股份特别针对Z世代进行调研,发布了2022新数智消费趋势报告。

当出众的外表不再是必要条件,虚拟数字人当真还能吸引外界的目光吗?虚拟数字人的“灵魂”和颜值,哪个更重要?基于这些围绕着虚拟数字人的问题,阿里巴巴研究员、数字人技术负责人李小龙接受了《每日经济新闻》记者的独家专访。

核心观点一:虚拟数字人需要“内外兼修”

或许是“肉体凡胎”的限制太过明显,大众已经对“虚拟偶像”展现出了不小的热情。

2021年央视春晚,虚拟偶像洛天依登台与真人明星合作演出。在某短视频平台上,虚拟偶像柳夜熙有着超过860万的粉丝,俨然已经是一个“大网红”。来自日本的初音未来更是成为了世界上第一个使用全息投影技术举办演唱会的虚拟偶像。

凭借着“超高”的颜值和正中Z世代胃口的“人设”,虚拟偶像可以做到在短时间内吸引到大量目光,这显然是一条成效显著的发展路线。一个潜力无限的市场正在这群虚拟偶像的面前缓缓拉开帷幕,iiMedia Research(艾媒咨询)预测,2021年中国虚拟偶像核心产业市场规模将达到62.2亿元,2023年将达205.5亿元。

然而,相较于赋予虚拟数字人引人入胜的外形,记者发现,阿里却在追求虚拟数字人的“内外兼修”。

以阿里推出的虚拟数字人冬冬为例,李小龙一直强调着冬冬的“内在”能力。李小龙认为,冬冬的突破之处在于,实现了拟真人的实时交互能力。这得益于达摩院多项核心技术的支持。

阿里虚拟数字人冬冬 图片来源:企业供图阿里虚拟数字人冬冬 图片来源:企业供图

李小龙接受《每日经济新闻》记者采访时表示,冬冬是一位AI实时驱动的拟真人级别的写实数字人,不需要提前录制或准备,她便可以实时与人交流和回答问题,甚至说脱口秀,能够给用户沉浸式的体验。

相较于赋予虚拟数字人出色的外表,李小龙更希望虚拟数字人是有灵魂的、是可交互的。据设计师介绍,在“颜值”的设计上,设计师专门为冬冬设计了较为普通且常见的形象。

众说纷纭中,阿里正试图定义虚拟数字人的“标准”。在李小龙看来,虚拟数字人应当至少满足以下条件之一,即能够模拟或接近真人的外形、交互及动作,“能够给人带来特定场景下的真实体验,这个初步定义的关键是,虚拟人需要在特定场景内真正解决人的问题。”

据了解,在深度融合了多模态理解和双工对话管理技术的基础上,达摩院构建了一套全智能驱动的数字人双向互动能力,使得数字人具备“听、看、演”的三位一体能力。此外,冬冬还具备自动言语生成的能力,即智能脚本生成能力(AI Script Generation,简称AISG)。

“我们希望冬冬能够具备一个有趣的灵魂,是一个风趣幽默的形象。”李小龙表示,冬冬具备的智能脚本生成能力是一种综合性能力,是自动的信息处理摘要、整个的结构化剧本生成和自动AI的脱口秀的生成等能力结合起来的结果,“当前市面上并没有看到别的虚拟人有类似的能力。”

除了在技术上追求虚拟数字人的高互动性,在外表上,阿里结合其地域、性格等人物设定,通过AI算法与原型定位结合,赋予了冬冬与真人近似度较高的人物造型。

如果说外形是虚拟人的外在,那虚拟人的自动生成内容、与人互动等能力就是虚拟人的内核。在目前阶段,打造“内外兼修”的虚拟人具备不低的技术门槛。这或许也是许多创业公司并没有选择从一开始就走这条道路的原因。

曾有报告总结过当前虚拟数字人行业内公司在发展路线上的不同选择。《2021年虚拟数字人深度产业报告》显示,在追一科技等厂商看来,技术是进入行业的核心门槛,需要进入玩家在机器视觉、语音交互和自然语言处理方面都具有身后的技术积累,并将三者有机结合。

科大讯飞则在技术方面强调了虚拟数字人向自我管理的演化,认知智能、灵活性、个性化、情感化都是虚拟数字人需要进一步提升的技术方面。虚拟数字人动作的细腻度和丰富度则为魔珐科技等厂商所强调。

“当前市场上的公司有很多种,有些公司将工作重点放在美术能力的突破上,有了美术能力的基础,就可以大量生产出虚拟数字人的模型,虽然这些虚拟数字人可能还得靠真人去驱动。”李小龙表示。

“我们希望有一个更为长远的规划,结合整个XR技术的发展,我们需要找到一个可持续发展的路径,”李小龙说。在他看来,只有通过技术创新上的突破,才能确立真正的竞争壁垒,“长久的商业化一定是通过技术创新实现的,这是毋庸置疑的。”

核心观点二:虚拟数字人尚处于价值验证阶段

任何一个行业若想真正拥有长久地发展,则必然需要在市场上找到自己的存在价值。记者了解到,在当前阶段,虚拟数字人已经探索出一定的应用场景。

CIC灼识咨询合伙人冯彦娇告诉《每日经济新闻》记者,虚拟数字人目前主要在文娱、消费领域进行商业化变现。

“虚拟数字人也可被打造成IP,通过‘圈粉’进行流量变现。如打造虚拟偶像进行直播带货、获取直播打赏、出售版权等;或是打造符合品牌调性的虚拟形象代言人进行品牌营销活动。”冯彦娇说。

冯彦娇认为,在商业化探索上,虚拟数字人不过处于刚刚开跑的阶段。究其原因,作为一个高科技物种,仅仅是通过“圈粉”变现,想必并不是业内探索虚拟数字人的初衷。此外,相较于打造一个虚拟数字人所需要的成本,目前的虚拟数字人变现情况显然并不尽如人意。

“在当前阶段,若想要打造一个拟真人的、具备一定AI驱动能力的虚拟数字人,成本投入至少需要百万以上。”李小龙说。

李小龙认为,虚拟数字人目前处于一个“价值验证”阶段,“在外界都很看好虚拟数字人的前景,但依然还处于大量投入的阶段。”

“相对来说,阿里在虚拟数字人领域有商业化场景。”李小龙提到,阿里已经在淘宝直播的场景中进行虚拟数字人应用落地尝试,“当前阶段,已经有600多家商家在尝试我们的虚拟主播,每天开播的超过200家。”

李小龙认为,对于虚拟数字人而言,电商直播间是一个已经被验证可行的商业化场景。

“虚拟数字人可以7*24小时进行直播,直播的商家不用去雇佣一个真人,这就帮助商家以更少的成本解决了效率的问题。”李小龙说。在他看来,通过对一个个小场景的探索,再逐渐拓展数字虚拟人业务的商业化空间不是纸上谈兵。

据李小龙介绍,阿里在虚拟数字人业务的尝试是由此前在智能客服业务上的积累孵化而来,目前在虚拟数字人业务上尚处于盈利探索期。对于这一个过程,李小龙表示他并不着急。他透露,“前期的探索和试水过程是必要的,智能客服大约摸索了五年左右才走上了大规模商业化落地的阶段。”

仅就电商相关的场景而言,李小龙预测,虚拟数字人可以在五年之内达到每年700亿到1000亿的市场空间。

至于整体虚拟数字人的市场空间,《2021年虚拟数字人深度产业报告》预计,到2030年我国虚拟数字人整体市场规模将达到2700亿元,迎来广阔的应用空间。


图表来源:《2021年虚拟数字人深度产业报告》图表来源:《2021年虚拟数字人深度产业报告》

除了电商之外,李小龙表示,很多虚拟数字人的应用场景都是值得探索的,但这是一个循序渐进的发展过程,“一定是在有限场景下进行逐步的迭代,先解决有限场景下的有些问题,然后慢慢跨场景、进入多个场景进行探索。”

以冬冬为例,便是阿里在场景探索上的最新尝试。据李小龙介绍,冬冬的具体的应用上可以跨越两个场景:不仅是一个可以在演播室展现出采访能力的主持人和记者,也是一名可以在直播间进行控场和卖货的带货主播。

核心观点三:虚拟数字人行业需要走向“标准化”

虽说商业化空间前景喜人,在对于未来的探索上,虚拟数字人产业尚还面临着一些需要突破的难题。

根据《2021年虚拟数字人深度产业报告》,虚拟数字人产业目前的行业门槛及瓶颈主要来源于三个方面,即上限偏高的技术和美术门槛;客户积累带来的业务认知以及在各细分市场亟待实现的标准化复制。

据李小龙介绍,目前虚拟数字人在技术上的难点主要在生成、驱动及交互上,“当这三个难点都能够得以突破,虚拟数字人大规模的生成和应用便成为了可能,剩下都便是如何去铺开场景的问题。”

相较于技术上的难题,李小龙透露,虚拟数字人在行业标准上的匮乏,也成为了限制虚拟数字人大规模商业化落地的主要原因之一。

上述报告提到,对于国内企业,由于主要应对的场景高度定制化,大规模化复制上存在一定问题,导致虚拟数字人的应用无法快速推广到各行业。

“目前在行业内,每个人对虚拟数字人的理解都不大一样,就是因为缺乏标准化。”李小龙表示,“我们也在积极推动整个行业走向标准化,包括评测的标准化、技术方向的标准化。

只是,虚拟数字人行业若当真突破了目前所存在的瓶颈,又将给外界带来哪些变化?

冯彦娇认为,随着未来技术的成熟与开发成本的下降,虚拟数字人将在各行各业得到普及。除了目前应用较多的文娱、消费领域;在各企业级场景,虚拟数字人也将开始在客服、营销、导览、心理咨询等场景得到应用。

李小龙则认为,未来将进入一个人机协同的世界,“我相信,在一个特定场景中,虚拟数字人确实能够发展到接近真人的水平,能够帮助人类在人机协同情况下大幅提升工作效率。”

“我们研发虚拟数字人并不是希望他们去替代人类工作,这在短期内也是不可能的。在未来,虚拟数字人可以代替人类从事一些简单、重复、难度不是那么大的工作,真正难度比较大的那部分工作,还是需要人类来完成。”李小龙进一步解释道。

不过,这都是后话了。当前的种种迹象表明,摆在行业探索者们面前的路还很长。在热度过后,若想虚拟数字人行业真正迈入成熟期,或许还需要探索者们躬身于行,早日在技术上达成突破。

对于虚拟数字人当前的热潮,李小龙有着相对清醒的认知。“虚拟数字人行业会呈现出一个曲线形的发展趋势。当前阶段,行业被炒到顶点,但由于投入产出比太低,已经呈现出往下降的趋势,之后会慢慢进入一个稳定上升的阶段。”李小龙预测。

标签:AI虚拟数字虚拟人

我的评论:

请  后发表评论。