Sora,模糊虚幻与真实

日前,OpenAI 发布了全球首个文(图)生视频模型Sora,一夜之间刷屏全球网络。

通过Sora,用户可以通过使用自然语言提示词,生成长达1 分钟的视频,并包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意味着,在继文本、图像之后,OpenAI 将人工智能技术拓展到视频领域。虽然Sora 模型目前尚未向公众开放,但是已经有人感叹:视频生产颠覆性革命来了。

OpenAI 官网展现了多段Sora 制作的视频,身着黑色皮衣、红色裙子的女子在雨后的夜晚行走在东京市区街道上,女子皮肤上的毛孔清晰可见,路面积水映出路灯倒影。视频十分真实。

Sora 不仅能够生成完整的60 秒视频,还能延长已生成的视频。更重要的是,Sora 可以生成不同机位、不同景别的视频,并进行剪辑。这不禁让人感叹:“真实和虚幻的差别,到底还有多大距离?”

同时,Sora 也带有世界模型的特质。所谓世界模型,简单点说,是要对真实的物理世界进行建模,让机器像人类一样,对世界有一个全面而准确的认知,让AI 视频更流畅,更符合逻辑。

从AI 制作视频的流程来看,当前的Sora 需要先输入一段文字,随后再生成视频,视频的原创性还是依赖创作者的审美,Sora 的工具属性更加突出。比起原创内容,Sora 的优势更在于, 可以节省特效片段耗费的大量人力物力。

所以,也有网友预测, 虽然未来视频制作流程中的剪辑师、特效师等后期岗位会面临更为严峻的处境,但Sora 未来能够代替更多机械、重复的工作,使得创作者可以集中精力于创新的、深度的解读,给文化消费者提供更优质的内容。

如果说ChatGPT 是语言的大师,那么Sora 则是一个多模态数据的通才,它通过视频、图片等多种数据形式更全面地理解世界。Sora 又有哪些应用场景?

新闻报道

借助Sora 模型,新闻机构可以在几分钟内生成一段生动的现场视频,让观众即刻了解事件全貌。这种快速、准确的报道方式,大大提高了新闻报道的时效。

广告创意

借助Sora 模型,广告商可以快速生成多个广告预览视频,使广告商能够迅速找到最吸引观众的创意方向,打造令人难忘的广告作品。

纪录片还原历史

Sora 模型为历史纪录片的制作提供了全新的解决方案。通过模型重建战争时期的城市、战场和人物,制作团队可以让观众仿佛置身于那个战火纷飞的年代。这种沉浸式的观影体验,让历史纪录片焕发新的生命力。

体育赛事

借助Sora 模型,体育赛事主办方可以生成虚拟的球场、球员和观众,为球迷打造一场身临其境的虚拟赛事盛宴。

电影制作

如果Sora 能够持续优化,那么未来的电影制作可能就像搭积木一样简单。你只需要将这些60 秒的片段巧妙地组合起来,加上一个吸引人的剧本,一个小团队就能打造出与《熊出没》《流浪地球》等大片相媲美的作品。

目前的Sora 仍处于1.0 阶段,仍然存在一定缺陷,在处理精细的背景时常常出现力不从心的情况,但没人会否认Sora 在通用人工智能实现路程上的里程碑地位。

(摘自“看电视”微信公众号,萝卜叶子图)