人工智能在去年给人类带来巨大冲击,不少声音指出在创意等方面人类尚无法被其取代。这一想法再次遭到挑战。当地时间2月15日,人工智能巨头,ChatGPT母公司OpenAI宣布,正在研发“文生视频”模型Sora,可创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色,也可以根据静态图像制作动画。根据OpenAI官网,Sora不仅了解用户提出的要求,还了解这些东西在物理世界中的存在方式。
目前,Sora仍在开发中,正在接受安全测试,尚未向公众开放使用。OpenAI CEO奥特曼在社交平台上向公众征集他们想看到的视频,表示公司将制作并发布。
OpenAI CEO奥特曼在社交平台发布Sora视频。
Sora视频一出,立刻震惊业界。此前,其他企业也有类似文本生成视频的AI模型,其中,谷歌正在测试名为Lumiere的模型,Meta则有名为Emu的模型,还有人工智能初创企业Runway也在开发相应产品来帮助制作视频。
针对Sora视频的发布,Runway联合创始人兼首席执行官Cristóbal Valenzuela 回应道,“游戏已经开始”。Runway是一家AI视频公司,几个月前刚刚推出了AI视频模型的第2代更新,并且已可供所有人使用。
人工智能图像生成领域的另一家领导者Stability AI在去年11月推出了生成视频模型Stable Video Diffusion,但表示它“专门用于研究”,尚未准备好用于“现阶段的现实世界或商业应用”(有一个等待名单,但该公司尚未透露何时发布)。
Pika Labs是AI视频领域的新晋竞争者,它于去年11月推出了生成式AI视频工具Pika 1.0,并于去年12月底宣布“等待(名单)已结束”,并向所有人开放。
谷歌最近发布了下一代人工智能模型Gemini 1.5,并公布了Lumiere 模型的研究和演示片段,不过目前还不清楚谷歌计划何时公开该工具,该公司表示需要强大的工具来对抗偏见和恶意内容,确保其技术能够安全部署。
Meta拥有包括Facebook、Instagram和WhatsApp在内的稳定应用程序,并于2022年首次推出了一款名为Make-A-Video的视频生成工具,该工具生成的内容明显虚假、扭曲和模糊,但在当时仍然是一项重大成就。
Meta在去年年底推出了一种新的文本转视频模型Emu Video,并表示几乎所有使用它的人都将其在质量和对文本提示的忠实度方面评为高于“仅仅制作一个视频”(Make-A-Video),在谈到该工具何时发布时,Meta首席执行官马克扎克伯格表示,Emu将被整合到Facebook和Instagram中。
特斯拉CEO埃隆·马斯克的人工智能初创公司xAI希望能够与DeepMind和OpenAI等行业领导者竞争,但尚未宣布文本到视频生成器的计划,尽管这种功能可能会融入到其人工智能聊天机器人 Grok中。
此外,亚马逊已经透露了一款面向工人的生成式人工智能聊天机器人Q和人工智能图像生成器,尽管这家电子商务巨头尚未透露何时计划推出这些工具,也没有透露是否会推出更先进的视频生成器。