今年初,OpenAI推出了名为Sora的“文生视频”工具,仅凭几段简短的视频,就让世人见证了AI在视频生成领域的强大力量。
凭借几个关于女性街头行走的提示词,Sora便能创造出堪比好莱坞大片的影视特效。与之前的AI视频生成工具相比,Sora用实力证明了AI并非人工智障,而是拥有无限潜力的人工智能。
Sora的出现,如同一块巨石投入平静的湖面,激起了层层波澜。有人担忧自己的职业前途,深感失业的焦虑;而有人则认为AI不会对自己的领域造成冲击,坚信人类的创造力远超无魂的AI。
正当众人议论纷纷时,一些敢于尝试的聪明人已经利用AI赚取了人生的第一桶金。
AI创业小队的商业模式
我们的故事从一个创业小队讲起。
西羊石团队,一个在AI视频生成领域奋斗的创业小队,由三位年轻人组成:大厂员工西堂、名校毕业生羊羊和程序员小石。
他们因对AI视频生成的兴趣而在一个知识付费社群中相遇。看到今年年初Sora技术的迅猛发展,他们感觉时机已到,可以开展一些商业化的项目。于是,三人一拍即合,在今年四月开始了创业之旅。
起初,西羊石团队在视频号上发布AI视频作品(如文旅广告片、儿童寓言故事等)来吸引粉丝。短短几个月,他们便打造了一个粉丝数过万的IP账号。在此期间,一些勇于尝试的公司向他们抛出了橄榄枝。他们逐渐开辟了第一条盈利的商业路径,即为B端和G端客户制作广告片和文旅片。
与传统影视公司制作的广告片相比,小石认为AI生成的视频广告片成本更低、性价比更高。“我们通过AI技术可以基本达到传统影视广告的效果,甚至在某些场景下更适合使用AI。在达到相同效果的基础上,我们节省了购买拍摄器材、实地拍摄的人力和资源成本,成本仅为传统影视广告的十分之一到五分之一。”
对于很多追求性价比的客户来说,AI生成的视频是一个值得尝试的选择,尤其是淘宝平台的中小商家和地方文旅部门。因此,自创业以来,西羊石团队并不愁接单。短短七个月,他们在广告片业务上的营收就达到了20多万元。这对于一个零高成本投入的三人团队来说,无疑是一笔不小的收获。
同时,他们还在探索第二条商业化路径,即通过互联网打造个人IP,吸引那些想要学习AI视频生成的人,为他们提供针对性的教学服务。简而言之,就是针对C端的知识付费业务。
他们围绕AI绘画视频教程和AI视频案例拆解,建立了一个层次分明的教学体系。既有价值10元的AI视频体验课,也有价值百元的AI视频陪伴群,还有价值五千元的AI视频私教课程。其中,10元的体验课购买人数最多,学员群已发展至五千多人;而价格较高的私教课程也有50位忠实用户。
据小石观察,愿意为AI视频课程支付高昂费用的用户往往是从事互联网行业的人,年龄在30岁左右,其中不乏程序员和视频制作爱好者。他们想要尝试用AI生成视频作为副业。由于社群基因偏向于互联网行业,传统影视行业的从业者相对较少。
虽然起步晚,但随着学员数量的不断增加,西羊石团队第二条商业化路径的营收也在持续增长,目前已接近20多万元,与B端业务的营收持平。相比定制化的广告片,这条路径的商业化推广更快,产品也更容易实现规模化复制。这个创业小队用自己的商业化成功向更多学员证明了这条路的可行性。在他们的指导下,目前已有25位学员成功通过AI视频生成赚取了收入。
虽然当前AI生成视频的概念非常火热,但技术尚不成熟。对于整个视频行业来说,AI带来的思想冲击远大于实际冲击。更多的客户仍然会优先选择传统影视行业进行合作,留给AI视频生成团队的机会并不多。
然而,AI的出现无疑在每个人心中都埋下了焦虑的种子。很多人都渴望掌握技术的先机,而不是被技术淘汰。因此,关于AI的各类教学课程在网上非常受欢迎。人们购买的不仅是课程,更是一份对未来的投资。很显然,在未来,掌握AI技术将占据优势。
如何用AI生成视频?
传统影视的拍摄流程大家都很熟悉,但如何用AI生成一支视频呢?这看似简单,实则充满技术含量。
骨朵曾多次尝试使用某AI视频生成软件的文生视频功能来制作自己想要的内容,但发现生成的结果往往令人失望。细细研究之后才发现,原来AI生成视频里面也有很多门道。不仅要输入准确的提示词,还要掌握正确的流程和方法。
小石告诉骨朵:“我们目前使用AI生成视频的全流程是先用ChatGPT等AI生成文字软件来生成文字剧本,再用MJ/comfyui等AI生成图片软件将文字变成图片,然后用runway等图生成视频软件将图片变成视频,最后再用剪映等软件来剪辑素材形成正片。”
之所以选择图生视频的方式,最重要的原因是:“在文生视频、图生视频和视频转绘这三种方式中,如果想要视频稳定且保持风格人物一致,图生视频的效果是最好的。”小石说。
在正确的流程和方法基础上,善用提示词也非常重要。否则,AI就会生成一些与预期不符的内容。一个准确的提示词能生成一张恰到好处的图片,进而生成合适的视频素材。“我们在写提示词时,会先确定图像主体(包括背景主体和图片风格),在这个基础上再进一步针对不同细节、角度和光线进行详细描述,以生成合适的图片。”
例如,为了生成一张14岁的“坏蛋”男学生图片,西羊石团队所使用的提示词先描述了动画风格,再描述男孩子的细节和神态:“Chinese anime style, 14 years old, full body photo, short hair, inch long, in the classroom, a modern Chinese male student, rebellious and fierce.”
生成合适的图片后,西羊石团队会将两张静态图片作为前后帧导入AI生成视频软件来形成一支动态的视频。这样一整套流程下来(除去与客户沟通的时间),制作一支AI广告片只需3到7天。
最近,西羊石团队制作了一支香菇肉酱的广告片。这支广告片展示了香菇肉酱的熬制过程和流淌在香喷喷米饭上的质感,令人垂涎欲滴。其中近距离的食物特写和酱料流动的细节处理都逼近实拍效果。
据团队表示,这支广告片的制作流程首先是使用Midjourney生成高质量、色彩鲜艳的食物素材图片,然后用这些图片来生成视频,并通过Runway最新的Gen-3来制作酱料流动的视频特效以使视频看起来更加丝滑和连贯;最后用轻快的剪辑、活力的背景音乐和艺术字来共同烘托出产品的独特风味。
AI生成视频软件的竞争格局
不得不说,AI生成视频的效果确实令人惊艳。有些视频甚至令人难辨真假,观感宛如实地取景拍摄一样。然而,有些视频又会令人觉得太过离谱,产生了各种“手脚错位”的恐怖谷效应。
根本原因在于AI还太不可控,因此反复在惊艳与离谱之间游走。瀚皓科技CEO吴杰茜曾表示,可控性是文生视频当前最大的痛点之一。很多团队都在做针对性的优化以尽量做到生成视频的可控。
小石对此也深有同感。他在使用AI生成视频时也遇到了很多困难:“第一是AI的理解程度不高。比如我们想要某一个物体动,但它生成出来的所有物体都在动。所以我们需要尝试很多次才能输出合适的视频;第二是人物的稳定性不高。视频前后的人物主体不一致,所以我们需要通过AI绘画、AI换脸进行精细化的调试;第三是审美不太行。两个画面的衔接很生硬,就像PPT一样不够流畅。”
这些种种不可控的因素是AI生成视频还难以大范围推广的根本原因。因此,很多传统影视行业的从业者也会觉得目前AI的实力被过分夸大了。他们认为AI的智商还相当于几岁的小孩,无法有效协助工作。AI生成视频离真正落地还有3到5年的时间。而作为新兴AI视频生成的从业者,小石认为关键的技术引爆点将是:“如果AI生成视频的人物一致性能够控制好,算力规模能够进一步升级,就能更快更好地生成视频并实现大范围的推广。”
如果AI生成视频真的能够与传统影视行业相抗衡,那么哪家AI公司能在这场商战中脱颖而出呢?
小石综合了自己所使用过的AI生成视频软件做了一个整体的优劣势分析。他认为:“国内的可灵软件优势在于操作简单、人物稳定性不错;但劣势是审美不行、画面衔接不连贯且对复杂场景支持不够。即梦软件的优势在于人物表情富有表现力且整体绘画风格比可灵要好;但劣势是画面一致性不高。国外的luma软件优势在于首尾帧转换很丝滑;但劣势是价格高。综合下来runway的效果是最好的。无论是对于提示词的理解、场景的稳定性、审美的艺术性还是性价比方面,runway都在一众软件中脱颖而出。”
虽然国外软件起步更早,在某些性能上优于国内软件;但国内的AI生成视频大模型却有一个独家优势——天然对中文的理解力更强。它能在大数据的支撑下生成更符合中国语境的视频,如国风和文旅类视频。
而且,惊艳众人的Sora至今仍未向公众开放。也许OpenAI还在酝酿一个更大的惊喜。在这场AI公司的大战中,谈论谁是冠军还为时过早;但毫无疑问的是,它们将彻底改变影视行业。一旦AI生成视频突破了技术的瓶颈,人们真的可以用寥寥几句话或几张图就生成出逼真的影像时,影视行业的高门槛将不复存在。
人人都可以成为影视创作者。只要有一台电脑,就能将脑海中的剧本变为现实。那一天会让很多人失去工作,也会让很多人乘风而起赚取人生的第一桶金。而在那一天来临之前,我们唯一能做到的就是更深入地了解AI——这个不知疲倦的学习机器、这个人类最强大的对手同时也是帮手。