Sora，模糊虚幻与真实 - 青年文摘-我爱过期杂志

日前，OpenAI 发布了全球首个文（图）生视频模型Sora，一夜之间刷屏全球网络。

通过Sora，用户可以通过使用自然语言提示词，生成长达1 分钟的视频，并包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。这意味着，在继文本、图像之后，OpenAI 将人工智能技术拓展到视频领域。虽然Sora 模型目前尚未向公众开放，但是已经有人感叹：视频生产颠覆性革命来了。

OpenAI 官网展现了多段Sora 制作的视频，身着黑色皮衣、红色裙子的女子在雨后的夜晚行走在东京市区街道上，女子皮肤上的毛孔清晰可见，路面积水映出路灯倒影。视频十分真实。

Sora 不仅能够生成完整的60 秒视频，还能延长已生成的视频。更重要的是，Sora 可以生成不同机位、不同景别的视频，并进行剪辑。这不禁让人感叹：“真实和虚幻的差别，到底还有多大距离？”

同时，Sora 也带有世界模型的特质。所谓世界模型，简单点说，是要对真实的物理世界进行建模，让机器像人类一样，对世界有一个全面而准确的认知，让AI 视频更流畅，更符合逻辑。

从AI 制作视频的流程来看，当前的Sora 需要先输入一段文字，随后再生成视频，视频的原创性还是依赖创作者的审美，Sora 的工具属性更加突出。比起原创内容，Sora 的优势更在于，可以节省特效片段耗费的大量人力物力。

所以，也有网友预测，虽然未来视频制作流程中的剪辑师、特效师等后期岗位会面临更为严峻的处境，但Sora 未来能够代替更多机械、重复的工作，使得创作者可以集中精力于创新的、深度的解读，给文化消费者提供更优质的内容。

如果说ChatGPT 是语言的大师，那么Sora 则是一个多模态数据的通才，它通过视频、图片等多种数据形式更全面地理解世界。Sora 又有哪些应用场景？

借助Sora 模型，新闻机构可以在几分钟内生成一段生动的现场视频，让观众即刻了解事件全貌。这种快速、准确的报道方式，大大提高了新闻报道的时效。

借助Sora 模型，广告商可以快速生成多个广告预览视频，使广告商能够迅速找到最吸引观众的创意方向，打造令人难忘的广告作品。

Sora 模型为历史纪录片的制作提供了全新的解决方案。通过模型重建战争时期的城市、战场和人物，制作团队可以让观众仿佛置身于那个战火纷飞的年代。这种沉浸式的观影体验，让历史纪录片焕发新的生命力。

借助Sora 模型，体育赛事主办方可以生成虚拟的球场、球员和观众，为球迷打造一场身临其境的虚拟赛事盛宴。

如果Sora 能够持续优化，那么未来的电影制作可能就像搭积木一样简单。你只需要将这些60 秒的片段巧妙地组合起来，加上一个吸引人的剧本，一个小团队就能打造出与《熊出没》《流浪地球》等大片相媲美的作品。

目前的Sora 仍处于1.0 阶段，仍然存在一定缺陷，在处理精细的背景时常常出现力不从心的情况，但没人会否认Sora 在通用人工智能实现路程上的里程碑地位。

（摘自“看电视”微信公众号，萝卜叶子图）