本文最初由@人人是产品经理 发表
AIGC在2023年确实很火,尤其是AI的爆发和AI生成算法的突破。毫不夸张地说,科技圈每天都有新产品、新变化,令人麻木。此外,数字人成为元界和AIGC两大趋势的中心,再次成为创投圈关注的焦点。
数字人的智能交互、个性化服务的实现、数字人的表达、商业化价值都在一定程度上赋能虚拟数字人,为数字产业和应用提供了新的发展机遇和前景。作为虚拟宇宙的核心元素,数字人类或许能够真正打通虚拟世界。有“人”的地方就有江湖,有“人”的地方就有交易。
什么是虚拟数字人?目前流行的解释是:虚拟数字人存在于非物质世界,通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创建和使用,具有多种人类特征(外貌、特征、人类表现能力、人类交互能力等)。市场上也常被称为虚拟形象、虚拟人、数字人等。代表性的细分应用包括虚拟助理、虚拟客服、虚拟偶像/主播等。
虚拟数字人具有三大特征:形象能力、表达能力和感知交互能力。形象能力,即虚拟数字人的拥有者的外貌,具有外貌、性别、性格等特定特征;表达能力,即虚拟数字人的主人的行为,具有通过语言、面部表情、肢体动作来表达的能力;感知交互能力是指虚拟数字人具有人类思维,具有识别外部环境并与人进行交流互动的能力。
毫无疑问,虚拟数字人是真实的需求,但目前的产业生态能否支撑这个需求呢?真的能降低成本、提高效率吗?移动互联网何时转向数字人?
目前,虚拟人已覆盖影视、媒体、金融、文旅、房地产、汽车、银行证券等多个场景。相信很多人都尝试过数字人产品,也有一些朋友正在做数字人直播带货。当然,大多数人只是尝试一下,放弃使用也很正常。毕竟,考虑到成本和效果,目前仍处于尴尬的过渡期。然而,AI生成算法的突破将极大提高虚拟人的语义理解和用户沟通能力,不同领域的虚拟人的自动化水平都将得到提升。
笔者这里主要从数字人市场背景、竞品核心功能、运营策略盈利模式等角度来谈谈数字人产品这个充满希望而又未知的物种。毕竟我对于新事物还是很乐观的。入选竞品为腾讯智影、D-ID、D-ID。这四款产品均来自国内外公司,大大小小的公司都在使用,我们就开始聊聊吧。
我们先看一下百度、抖音、微信的搜索指数。微信最近一直在崛起。
一、市场背景
艾媒咨询报告显示,从市场规模来看,2022年中国虚拟人驱动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计将达到6402.7亿元和480.6亿元。分别于2025年呈现强劲增长。增长趋势。随着娱乐需求的增加和人工智能等技术的不断迭代,中国虚拟人产业快速发展,元宇宙的热潮加速了虚拟人产业的升级。
用户调查数据显示,中国受访者对虚拟人的认知度达到88.0%。他们经常接触到的三类虚拟人是虚拟员工、虚拟偶像和虚拟主播。其中,虚拟主播的受众范围最广,达到64.1%。虚拟人的应用已经逐渐突破次元壁。虚拟与现实的交织,为属于虚拟生态系统的市场开辟了空间,虚拟文化开始被大众接受。
2、从宏观环境看虚拟数字人(PEST)
1.
国家大力鼓励和支持新兴文化业态,发展文化产业,推动数字文化与相关新兴产业融合。虚拟数字人作为数字文化产业和网络直播的综合产物,是未来社会文化强国战略目标的重要驱动力。相关政策今年也已推出。
此外,2022年上半年,北京市经济和信息化局印发《北京市促进数字人产业创新发展行动计划(2022-2025年)》。发展目标提出,到2025年数字人产业规模将突破500亿元,这是我国首个针对虚拟数字人的专项政策。
2.
艾瑞咨询数据显示,2022年中国数字经济规模约为50亿元,行业将带来发展机遇。
此外,陀螺研究院《2023年全球虚拟数字人产业报告》统计显示,2020年至2022年间,全球虚拟数字人企业数量同比增长2.7倍,投融资事件从12起增至44起投融资总规模由1.65亿元扩大至49.88亿元,投融资总规模同比增长29%以上。 2021年最大一笔投资来自韩国元界虚拟社交平台,融资金额12.1亿元。
3.
数字文化产业逐渐成为我国文化产业发展新的增长点。 2022年,中国文化企业实现收入1亿元,比上年增长0.9%。 2016年以来,全国文化及相关产业增加值总体呈现平稳增长态势,2021年增速基本恢复到疫情前水平。2022年,我国人均教育文化娱乐消费支出为2469元,占消费支出总额的10.1%。
数据显示,2020年至2022年,我国网民规模将呈现逐步增长趋势,其中网络直播用户数量将大幅增长。截至2022年12月,网络直播用户规模达7.51亿,占网民总数的70.3%。近年来,随着技术的发展,虚拟主播行业已成为直播领域增长最快的市场。 “元界”概念的流行和“Z时代”的兴起,吸引了更多资本进入虚拟主播行业,用户和从业者规模将进一步扩大。
(以上数据来源:中国互联网信息中心、数据中心())
4.
虚拟数字人产业的发展涉及多个技术领域,涵盖AI技术、RPA、云计算、大数据、物联网、5G等。-19疫情也加速了该行业的发展和应用。
虚拟数字人的概念随着技术的发展而不断迭代更新。早期,由于技术限制,用户体验被用户诟病如文字破损、图形丑陋等。然而近两年,CG、动作捕捉、AI等技术不断创新,虚拟数字人的视觉体验和制作更加成熟和完善。 5G的大规模发展也为虚拟人提供了更好的支持。
2022年11月发布后,生成式AI一路高歌。国内的产品如百度的“文心一言”、阿里巴巴的“通易千问”等都在不断更新迭代。自然语言生成技术加速了数字人类智能水平。必然要应用到不同的领域才能发挥其效果。目前,24小时直播已初具规模。
像生成人工智能这样的大型语言模型可以帮助数字人类获得一些优势,例如:
数据显示,到2022年底,我国人工智能企业数量将接近4000家,核心产业规模(增加值)将达到5080亿元。
既然已经分析了 PEST,就不能排除 SWOT。
3. SWOT 着眼于虚拟数字人
优势():
缺点():
机会():
威胁():
总体而言,虚拟数字人作为一项新兴技术和产品,拥有诸多机遇和潜力,但也存在不少挑战和风险。企业需要加强技术研发和安全保障,了解市场需求和用户需求,探索和完善商业模式和盈利模式,才能增强企业在虚拟数字人市场的竞争力,获得更好的市场发展和商业回报。
(是的,你没看错,SWOT一看就是这么套路废话写的)
4、竞品简要分析
虚拟数字人发展至今,诞生了很多IP,比如国内第一虚拟歌手洛天依、科大讯飞的路亚、百度的杜潇潇、缘缘科技的天语、阅文的叶修……,相关的也有很多。公司。这些都是具体的角色。本文仅简单讲一下笔者在自媒体圈经历过的数字人制作平台:腾讯智影、D-ID、。
由于我们这里关心的是用户对产品的使用,所以我们简单讲一下数字人相关的核心功能、运营策略和盈利模式。毕竟除了核心技术之外,运营赚钱的能力也很重要。其他如产品体验、用户画像等不再分析。
1.腾讯智能视频
产品:腾讯智影是一个集素材采集、视频编辑、后期打包、渲染、导出、发布于一体的在线剪辑平台。可为用户提供端到端的一站式视频编辑制作服务。
核心功能:
目前,腾讯智影()还拥有很多功能,包括各种智能小工具。这里我们只看数字人回放的核心功能,简单总结一下它的能力。
从他的能力来看,主要有两个方面:视频剪辑和数字人剪辑。视频剪辑能力是常规,当然融入到数字人视频中确实相当强大。目前给出了数字人编辑的图像和动作,每个角色对应一个特定的图像。虽然已经显示,但目前不允许编辑。数字人只能看到合成后的动态视频。合成之前的数字人是静态的,并且受到当前技术的限制。合成数字人类有两种方式:文本和音频。从技术经验来看,这两种方式是相辅相成的,肯定是同时出现的。
我们最关心的是数字人的姿态和表现。会员可以使用的数字人效果还是不错的。除了脸型、头型、唇形之外,还有手势的变化。唇形效果与数字人物角色有关。有的不是很好,但是有的数字人还是很优秀的。
此外,关于AIGC的其他能力,“文章转视频”可以自动生成文本,然后匹配数字人物进行播放。两个月前推出的配套智影小程序也集成了AI绘画能力,但网页版尚未实现该能力。
运营策略及盈利模式:
看看最基本的模型((获取)、(激活)、(保留)、(货币化)和(推荐))
先把图片发上来
招聘:
保留:
促进活力:
转换:
目前的盈利模式也比较明显。无论是C端用户还是B端用户,都是收取会员费的。此外还有企业定制、代理合作。
简而言之,盈利模式:会员+企业定制+代理合作
2.
产品:只需20分钟的视频,跳跃引擎就能为你打造一个突破自己语言、表演、时间、空间限制的超级克隆。
核心功能:
将视频制作和头像定制分为两部分。制作视频的方式有多种:pdf上传、模板制作、直接制作。这些方法没有太大区别,只是材料来源不同。另一种是创意站,分为一键视频生成和趣味视频两种。
视频制作方面,提供了基本的内容元素编辑功能。数字用户只能选择官方的,声音不多,目前只支持中文。创意网站的风格很多,一键视频生成中给出的一些选项也是基于目标产品的推广,可见目标群体还是很明确的。通过一些关键词,自动生成数字人视频。 GPT 集成非常好。我没有看到自定义副本。能脱离普通的视频创作吗?似乎没有必要。同样,创意视频还集成了AI绘画生成头像的能力,可以提供文字或音频。这里的文字也是定制的,但是这里的头像是可以上传的。您最关心的数字化人员有哪些能力?便于使用!面部姿势和唇形效果不错,但目前只有半身数字人。
可以看到目前已经集成了一些AIGC的能力。虽然不是很完美,但是基本的功能已经有了。从官方版本迭代信息来看,上线迭代时间不到两个月。上面提到的虚拟人物定制场景对话的能力还没有看到,但这应该是下一步。我很期待这一点。
运营策略及盈利模式:
先上图
招聘:
最重要的动作是在微信上分享视频,而不仅仅是链接
保留:
促进活力:
公众号(目前有视频但无图文)和视频号,发布相关视频。
盈利模式:
我们所做的是按照使用时长收费。仅加上套餐,算下来每分钟8-10元。另一个是企业定制。包括一些核心功能信息显示,整个东西看起来更加面向B端用户。 API也包含在常规套餐中,所以主要由套餐费+企业定制组成
3.D-ID
产品: 和 与 的 a 、 to 和 。
核心功能:
D-ID是国外的数字人产品。它很简单,只有两个功能,一是数字人视频制作,二是数字人聊天。另外,它还提供了接口供开发者使用。
D-id 聊天号称是第一个实现面对面对话的应用程序。只能免费使用40次,目前无法更换数字头像。唇形看起来很一般,头部姿势也很一般。音色还可以,后端调用微软的音色库。
头像支持自行上传合格图片,也可以使用素材库中的图片,也可以使用AI绘画生成。这些方法被认为是优秀的。支持的语言很多,各个国家都可用,并且有多种声音和风格可供选择。尝试了一下,中文输出唇形还是一般,英文输出还是不错的。

使用起来依然简单明了,但汉字和头像与国外产品还是有一些差异。另外,值得一提的是,接口开放给开发者使用,这也体现了其产品定位。
运营策略及盈利模式:
我们没有看到该产品有太多的营销和运营策略。感情会通过产品自然增长吗?
不过盈利模式相当清晰:会员+企业定制+第三方开发使用
它提供了五种支付策略:Lite、Pro、、。综合来看,还是很贵的。
4.
产品:最适合您团队的人工智能
核心功能:
创建数字人有 4 种方法:
从 URL 创建:
仅支持亚马逊产品链接一键制作视频介绍产品。
现有项目编辑器
从模板创建:
提供多种类型模板
创建自:
选择数字人物编辑
创建视频后,一些核心内容如:数字人编辑、文字上传编辑和生成、声音编辑、视频编辑等。数字人支持上传图片和AI绘画生成。您也可以直接在素材库中选择三种方法。点击数码人图像也可以作为图层来进行一些编辑操作。 。可以直接输入文本,也可以使用生成的脚本。当然,也支持直接上传声音。视频编辑者可以添加、删除和修改各种其他元素,还可以上传PPT和PDF文件来生成视频内容。
音视频数字人的生成、编辑等功能齐全。我们来看看我们最关心的数字人的效果,但也有只有头像的半身数字人。体验过后,无论是中文还是英文,头部姿势,包括手势、体型,还有最重要的唇形都已经非常逼真了。官方他们的宣传视频和模板里的数字人物都很好,但我上传的就稍差一些。
运营策略及盈利模式:
我们先来张照片
招聘:
保留:
促进活力:
盈利模式:
除了Free之外,还有两种会员模式和Pro。在每种模式下,您可以选择相应的时长并支付相应的价格。还有企业定制。该 API 包含在 Pro 中,并且仅对会员可用。
因此,目前的盈利模式似乎是:会员+企业定制
5、四款数字人产品的SWOT对比
从产品、核心功能和运营模式上,我们可以简单地看到一些差异和优缺点,总结如下。
以上还不够全面,有遗漏的读者可以自行弥补。无论技术能力如何,总体方向是视频编辑、AIGC集成、数字人定制、数字人对话等,产品目前还不是很全面,都还处于探索阶段,离成熟还很远。阶段。
以上四个是最好的,也为其他产品提供了思路和方向。智影的定位更偏向于视频制作软件,素材丰富,方向是成为服务商。虽然d-id功能单一,但如果专注于数字人视频和对话,未来有望提供技术服务。虽然并不完美,但作为一个新生产品,在国内还是有优势的,值得期待。
6. 最后的话
作为一个技术需求旺盛的科技行业,无论是创投圈还是普通人都看好它,但是我们如何才能进入呢?降低风险?也是一个需要思考的问题。
从发展来看,政策越来越完善,产品或者创业环境还是比较好的。今年,生成式AI技术加速了数字人类的发展。此外,其他行业的发展也推动了更大的市场需求,用户接受度也在不断提高。 “生意的最终目的是带货”,数字人是亮点。
回到标题,我想大家心里都有自己的答案。
最后一些想法:
请注意,本文内容仅从一位用户角度出发,可能与实际产品定位不符,请自行判断。
过去推荐的