说到短视频特效,大家可能首先想到的是“抖音特效”。
是的,抖音的特效似乎总是很受欢迎,像是用一段视频让你“回到三岁”:
△视频来源@赖美云
或者一招破次元壁,PDD也变帅气:
其实,国内外有很多APP都在运用AI相关特效技术,但在手机上运行之后,抖音往往是最受欢迎的一个。
对于类似的特效,其背后所采用的AI技术其实也差不多,但抖音制作的特效渲染得更逼真、运行更流畅,产品热度也更高。
抖音影响力经久不衰的秘诀是什么?
仅5M,效果媲美虚幻引擎
一个特效的创意难以预料,但渲染效果和计算时间却可以打磨到极致。
其中,渲染效果依赖于CV(计算机视觉)+CG(计算机图形学)两类算法的提升,而计算时间则依赖于模型的优化。
对于计算机来说,CV算法让它们能够精准的“读懂”一张照片的内容,从特效拟合、实时跟踪精度等小细节,到整张图片的分辨率提升、风格变化,都属于CV算法的范畴。
像合成一个菠萝贴在脸上的特效、老照片的高清修复,或者是“重返三岁”、“漫画脸”这样的整体风格迁移,都在CV算法的“职责”之内。
抖音使用的CV算法基本都是自研的,仅在CVPR 2021大会上,字节跳动就有14篇论文入选合作,涵盖NAS、图像修复、行为识别等领域,同时在移动物体检测、细粒度图像识别、视频分类等细分领域的比赛中斩获冠军。
说到CG算法,它可以让计算机制作出栩栩如生的特效,并与CV算法相结合,使其适合图片或视频。
像常见的PBR算法,只是基本的渲染操作;电影中常用的粒子系统,抖音在手机特效中也有所运用。此外还有透明材质和效果……更加贴近真实场景,而不只是2D贴纸。
△3D渲染与2D程序化火焰效果对比
不过无论是CV算法还是CG算法,模型越大,渲染效果就越好。
影视行业甚至流传着这样一句话:“如果用专业渲染算法实现一秒钟的顶尖特效,可能需要50天的连续渲染。”
这样的特效模式根本满足不了用户的实时拍摄需求,更谈不上流畅度了。
但据火山引擎技术专家杨辉介绍,的5MB渲染效果可以达到与虚幻引擎相当的效果。
没错,为了保证特效的流畅运行,抖音的特效模型被严格限制在5MB以内,以方便用户实时使用。
这5MB包含了模型、纹理、动画、特效和逻辑触发机制等所有文件。
极度压缩的计算时间背后,是自研渲染引擎+云渲染技术的结合。
在渲染工具方面,抖音没有选择使用虚幻引擎进行特效制作,而是研发了自己的针对短视频和AR的轻量级渲染引擎。
自研引擎重点增强了短视频拍摄所需的特效算法,舍弃了一些游戏独有、短视频不需要的特效,以保证渲染效果。
同时,为了让特效能用上更好的渲染算法,抖音还自主研发了云渲染技术,让原本需要使用手机硬件计算的特效,在服务端进行计算,然后实时将效果传输给用户。
这样一来,原本需要GPU级计算的渲染效果,现在就可以在手机上实时完成,带来的提升是显而易见的。
例如渲染算法中的粒子系统,只有通过GPU计算才能发挥较好的效果(烟花效果);相比之下,通过CPU计算的粒子系统效果就比较弱(控雨效果):
△2021年烟花特效及控雨特效
不过,前沿的CV+CG算法、自研工具只是抖音特效秘诀的一部分,它之所以能拍出如此多的爆款,与其成熟的制作流程和覆盖全场景的工业化体系密不可分。
火山引擎:技术井喷
一项技术是否能够长青,取决于它带来的产品是否能够量产,以及适用场景是否全面。特效也是如此。抖音特效已经满足了这两个条件:
一方面,根据抖音与火山引擎联合发布的《抖音特效数据报告》,2021年上半年,抖音平台平均每天上线特效产品超过100款,每5个用户投稿中就有1个使用了特效。
这意味着抖音已经具备了精简特效制作的能力,同时这些特效的质量也足以让五分之一的投稿人使用它们(抖音的用户现在已经达到6亿)。
这也让特效设计变得更加简单。在抖音把特效变成“创意生产线”之前,特效设计师并不是一个“门槛低”的职业。据抖音人气设计师尤洋介绍,他原本是做影视后期的,却成功成为抖音特效师,身边也有越来越多的同事投身到这个职业中。
另一方面,抖音特效技术的应用场景已经不再局限于抖音APP内,而早已触及各行各业。
在汽车行业,通过特效实现AR看车;在美妆行业,通过特效进行AR试妆;在传统媒体行业,利用数字人技术打造虚拟主持人、虚拟客服……
△AR试妆
可以预见,抖音特效已经不再是原来拍摄短视频时使用的特效,而正在逐渐成为一种“创意数字内容”。
火爆的特效,已经成为字节跳动成长秘诀中另一个不可或缺的重要组成部分。
现在,字节跳动将它们全部公开——以火山引擎的形式。
没错,就像飞书是字节跳动管理能力“爆发”的产物一样,火山引擎的诞生也是字节跳动技术能力“爆发”的结果。
作为字节跳动曾经内部使用的技术平台,火山引擎不仅“存储”了抖音所有特效背后的算法技术能力,还囊括了特效从制作、品控到实现的全部工程技术。
制作方面,为了加快制作速度、降低技术门槛,字节跳动将抖音特效背后的算法技术变成了各种模块化的组件。
例如抖音将常用的CV、CG算法做成组件后,设计师只需要拖动阅读条或者按一下按钮,就可以在特效中使用此功能。
对于整个算法的制作流程,从训练到推理,抖音都采用自己的推理框架和训练平台,以保证APP最合适的运行速度。
在质量评审方面,特效设计师制作的效果会进行评分,资质足够者才允许上线;同时,字节跳动还成立了专门的创新团队,保证算法的前沿性和创新性,设计出更多符合设计师需求的组件(很多顶级会议论文都出自这里)。
在具体实施上,抖音还会考虑不同场景下用户的体验和客户的定制需求。
例如,抖音通过针对不同手机性能分级策略、优化运行速度等技术手段,将系统崩溃率降低到十万分之一。
同时通过资源分配等技术,保证用户无需更新软件就能使用新的特效;面对不同的场景,抖音特效还能适配不同的分辨率、界面类型和机型。
这一切,加上前沿的算法技术,构成了抖音特效成功的秘诀。
“字节科技没有秘密”
7月28日,火山引擎与联合宣布,数万种与相同的特效将提供给客户。
这意味着字节跳动正在将抖音特效的所有优势,包括算法、道具资源等,对外提供技术服务,让更多人享受到这一巅峰之作的成果。
目前,动球帝、心心APP等一批企业产品已采用 作为业务增长技术。
未来,火山引擎还计划进一步引入端云协同、多人交互等最新技术,提升用户和客户的特效体验。
可以想象,更精致的特效、更多的互动技术将成为抖音未来的发展方向。
与此同时,特效技术的发展也将进一步给各个行业带来更多惊喜。
以影视和游戏行业为例,这两项技术可以大大降低视频后期制作和游戏美术成本。例如给人物加马赛克或者制作智能贴纸,不再需要逐帧手动调整,算法可以自动完成这些步骤。
字节跳动将所有增长技术全部公开,是怕同行的竞争吗?
杨辉说他不怕:
随着时间的推移,任何新技术的进入门槛都会越来越低,我们能做的不是打价格战,而是不断拓展、更新技术,保证自身的竞争力。
从这个角度来看,字节跳动的增长技术确实没有什么秘密。