就在2月16日,OpenAI发布了视频大模型Sora。注意,按照OpenAI自己发布的技术报告,Sora的定位是,作为世界模拟器的视频生成模型。世界模拟器,这个词非常重要,至于原因,接着下面细说。
Sora带来的震撼有多大?尽管目前还没有具体的数据,但你从各个行业的反应中也能看出个大概。
比如,就在Sora上线后的72小时,有14家券商,发布了19份相关的研究报告。而且这个数字现在还在增加。招商证券说,Sora将推动AI视频生成进入一个全新的时代。华泰证券的报告说,视频AI进入大规模应用的前夜。天风证券的报告说,下一个亿级用户的互联网平台雏形已然出现。
再比如,马斯克在X上留言,说gg humans,其中gg是good games的缩写,有点输得心服口服的意思。而gg humans就是,人类愿赌服输。
过去的72小时,关于Sora的报道非常多,今天咱们就做个总体的梳理,主要说三件事。
一,Sora到底厉害在哪?你要是去看关于Sora的介绍,几乎所有的文章里都提到这么一句,叫,给它一段剧本,它能给你一部60秒的电影。注意,这个真正的颠覆,不在于电影,而在于长度,60秒。
在Sora发布之前,视频生成AI已经存在。这个领域里公司有两家,Runway和Pika。但是,他们生成的视频,上限就是几秒。注意,这是个非常要命的制约。你要想做一段30秒的视频,就得让AI生成几次。但问题是,这几次生成的视频里,人物、环境、细节,不可能一模一样。这就导致这些视频有很强的碎片感。你很难把它们缝合成一个完整的片子。但是这回,Sora的视频上限是60秒,刚好是一条广告的长度。
换句话说,假如你是一个分镜能力很强的编剧或者导演,理论上说,你已经可以用Sora来接活儿了。所谓分镜能力,就是你用文字描述画面的能力。比如,你想表达天气很热,就可以这么描述,全景,地面机位,马路上的地面,空气因为升腾的热浪微微变形;特写,一个男人的下巴,豆大的汗珠掉落在地上。这么两个画面接在一起,就可以表现天气很热。
总之,只要你的要求提得足够清晰,且视频长度在60秒以内,那么Sora几乎可以零成本地执行你的所有设计。
当然,Sora生成的视频有没有缺陷?那肯定有。但问题是,这个性价比太高了。要知道,在广告、视频、宣传片制作上,三维制作的报价弹性是大的,属于烧起钱来没上限。一个30秒的节目片头,报价能高到百万左右。但现在,用Sora制作,成本几乎可以无限压缩。
但是,说到这,好像整件事只是围着视频行业转。但事实上,Sora释放的信号远不止这些。这就是咱们要说的第二个重点。Sora的本质,是作为世界模拟器的视频生成模型。注意这个词,世界模拟器。也就是,能够模拟真实世界运行的规律。
比如,有这么一组画面。一只狗跑过来,小孩子本能地闪开。狗咬了地上的食物一口,食物上留下了狗的牙印。这个画面在咱们看来再平常不过。但这里面,却隐藏着这么几个真实世界的规律。首先,小孩看到狗跑过来,会害怕。其次,人在害怕的时候,会本能地避让。因此小孩子看到狗跑过来会躲开。然后,狗咬了一口食物,会在上面留下牙印。换句话说,AI得先理解真实世界的规律,才能生成符合现实情况的画面。
没错,真正让各行各业兴奋的,并不是Sora生成视频的能力,而是这背后体现出的,Sora理解真实世界的能力。也就是我们经常说的,世界模型。注意,关于Sora到底能不能称为世界模型,这件事本身是有争议的。按照人工智能专家杨立昆的说法,Sora离世界模型还很远。但也有很多人认为,尽管Sora还不完美,但这至少意味着AI往通用人工智能又迈进了一步。
而每回谈起AI,有一个话题肯定绕不过去。这就是,它会不会抢走人类的饭碗?这回,不讲大道理,只说一个职业。这就是导演。导演是怎么工作的?搞懂这个问题,也许会对你理解其他职业的优势有所启发。
前面说过,Sora对视频和影视行业的影响最直接,很多初级动画师都会面临工作方式的颠覆。那么,作为视频行业最核心的工种之一,导演,他们的处境怎么样呢?
为什么?这要从导演这份工作说起。导演是做什么的?按照通常的想象,导演肯定是负责统筹各个环节,把摄影、灯光、演员都调配起来,把片子拍好。但是,关于导演,行业内流传一个定义,叫,真正厉害的导演,是那个“不择手段”,把片子拍出来的人。
注意,这里说的不择手段,指的是,你不能被任何现有的条条框框束缚住,你得有点超脱于技术流程之外的创新意识。
比如,早些年特效不发达,你要想把一个画面拍出朦胧的柔光效果,怎么办?很简单,在镜头上蒙一层丝袜。再比如,你要想把一道菜拍出热气腾腾的效果,怎么拍?是有人对着菜抽几口烟,然后拿盖子闷住。等开拍的时候把盖子掀起来,就有种热气腾腾的效果。
注意重点,可不是这些手段本身高不高。而是,它们全都不在书本上,不在所谓的规范操作之内。而导演要做的,就是确保最终效果。至于用什么手段,自己想办法。
换句话说,导演真正的能力是,把周边的一切资源,都整合到自己的目标体系里。
你看,这个定义,放到别的职业上似乎也成立。今年好多人说,世界是个草台班子。但话说回来,草台班子跟专业团队的分界线在哪?借用康德的一句话,人是目的,不是手段。没错,草台班子的本质,是一堆手段的集合,大家各忙各的。而专业团队,是一个高度统一的目标系统。
从这个角度看,新工具对一个职业的影响,关键就看,这个人是把自己的职业看成目的,还是手段。手段可以随时换,但目标一直都在。