2024 年支付宝五福节活动收官,AI 科技体验新年味成亮点

2024-11-16
来源:网络整理

2024年支付宝五福节活动圆满结束。支付宝数据显示,今年春节期间,近6亿人通过AI技术体验了年味。 “大家来找福”成为最流行的福卡收集方式,累计近30亿个AI生成的“福”字被用户发现。在支付宝上用AI玩、拍照的人中,70%是90后、2000后。

支付宝从2016年开始领取五福奖金,到2019年,分享五福奖金的人数达到3.27亿。 2020年开始,五福征集活动热度趋于稳定。与早期的互联网金融和移动支付相比,如今支付宝的“五福”不再只是造势、吸引新客户的营销活动。

对于支付宝,乃至整个蚂蚁集团来说,“五福节”和“双十一”一样,都是国家级项目,被赋予了蚂蚁技术迭代的基因。通过特殊时期大规模、爆发性的人流,推广支付宝的培训技术。”

如今,支付宝正在思考如何让“五福”红包里的钱更值钱。

五福节背后的AI训练

1月28日晚上8点,蚂蚁A空间8号楼支付宝楼层仍然挤满了人。支付宝全体员工在这里待命,为2024年“五福节”的上线做准备。

“五福节”上线前,支付宝内部进行了多轮压力测试,真实模拟了“五福节”场景。 AI技术的加入,确实增加了吉五福的测试难度。早期压测过程中发现并修复了数千个技术漏洞,AI游戏中的小bug更是数不胜数。

“上线前夕,我们团队数百人几乎整晚都在观看。”陈亮,绰号君毅,现任支付宝CTO,也是蚂蚁集团17年的技术老手。经历过多次五福聚餐活动的陈亮认为,历年支付宝在这次五福节上投入的资源和精力最多。

尽管前期准备充分,但此次推出的四种AI新玩法,依然给整个“找运气周期”带来了前所未有的压力。

据本文作者测试,五福节首日,在支付宝实测的“表溪小剧场”中,生成视频显示的等待时间为57秒,实际生成视频的时间为57秒。制作的视频大约三十秒。

2月4日再次测试时,生成时间仅用了15秒。 “时空影楼”功能仅需几秒即可生成一张6人合影。

长期以来,机武服活动的技术需求主要集中在分布式技术上,比如。截至目前,支付宝在基础算力、异构计算、安全风控等方面都积累了深厚的技术积累,如今加入AI功能的五福节,也让支付宝的AI(AI基础设施)经受了考验。 。

福支付宝扫福_5福支付宝_福支付宝福字

2022年至2023年,支付宝建立了万卡规模的计算集群,不仅包含传统的CPU资源,还大规模引入GPU、FPGA等异构计算资源。该资源的综合使用,使得支付宝能够针对不同的计算任务选择最合适的计算资源,从而保证高效计算的同时也降低了计算成本。

在吉五福事件中,支付宝利用其在异构计算方面的技术积累,成功应对海量用户参与带来的极限计算压力。从AI游戏的实时渲染,到用户交互数据的即时处理,支付宝保证了五福节期间的流畅运行和快速响应。

通过对异构资源的高效管理和调度,支付宝可以更快地完成AI模型的训练过程,让AI模型更快迭代更新,从而更好地支撑AI在支付宝各项业务中的应用线。同时,在处理大规模数据时,异构计算技术的应用也显着提高了数据处理的速度和效率,为支付宝提供了更强大的数据分析能力。

算力的问题可以利用异构计算技术和万卡集群来解决,但陈亮更想解决的是软件问题。 “人工智能的实现不能总是依赖堆卡,我们必须在软件和算法层面寻找突破,提高效率。”在五福节AI游戏开发过程中,支付宝使用蚂蚁集团大模型开源分布式训练加速扩展库,针对不同模型和硬件资源,将深度学习的自动资源动态优化和分布式训练稳定性提升2.3次。

“根据历年五福节的经验,会有数亿人参与。如果蚂蚁的AI能够在可控的成本范围内支持五福节,一定能够支持AI在支付宝的大规模落地。”未来。”陈亮坦言,双方国庆、五福节等活动为支付宝提供了一些极端场景下的测试机会。这样的机会对于国家级的申请来说是弥足珍贵的。在这些特殊时期,会遇到很多传统技术难以解决的问题。这些极端场景不仅暴露了现有技术的缺陷,也促使支付宝乃至整个蚂蚁集团的技术不断迭代升级。

储备AI开发能力

“教AI写福字并不难,几个人十多天就可以完成。”陈亮表示,今年五福节,征集福字的主力军:AI版的《来找福》是一个(扩散(公式))模型,制作流程其实很短。

大多数没有经过特殊训练的文森图模型无法书写。不过,如果只教AI写“福”字,训练过程并不复杂。

AI生成的“福”字和之前的AR扫卦有些类似,都需要提前收集一些“福”字。事实上,AI训练所需的“福”字数据量更小。只需要几百个“福”字,就能教AI画出一幅融入“福”字的山水画。

然而,后续的训练和微调过程仍然困难重重。首先,必须使用数据增强技术(例如旋转、缩放和扭曲)从有限的样本中生成更多的训练数据,以提高模型的泛化能力。在预训练过程中,应将所有样本调整为统一的尺寸和分辨率,并进行一些基本的图像处理,例如二值化或去噪。

训练一个可以写“福”字的模型很容易过拟合,特别是在训练数据集不够多样化的情况下。这个问题需要通过正则化技术或数据增强来缓解。在评估模型的过程中,还应该使用目视检查或设置一些自动化的质量评估标准,以避免输出过于简单。此后,可以根据初步输出结果对模型进行微调,以提高生成字符的准确性和风格多样性。

打造一款能够在短时间内稳定服务千万甚至过亿用户的产品看似复杂,但在陈亮眼中却非常简单。因为这些功能的开发背后,有蚂蚁的AI模型训练经验、自主研发的AI以及合适的AI开发工具。

福支付宝福字_福支付宝扫福_5福支付宝

“这次五福节与以往不同的是,既简单又困难。”陈亮认为,困难在于这次推出的AI功能。 AI是一个全新的事物,不像双十一已经比较成熟。 。原因很简单,就是在这个五福节期间,Ant自研的代码模型融入到了编程工作中,为代码开发提供了很多便利。

它是Ant基于自主开发的百灵模型开发的开源代码工具。它提供了代码补全、代码解释、代码优化、单元测试生成等功能。目前已获得超过 3,400 颗星。

“可以看作是蚂蚁大模型研发的第一阶段,目标是服务好自己。”陈亮表示,目前50%的Ant程序员在编写代码时使用的是整个站点使用的Ant程序员编写的代码。大约 10% 的代码是由 .

蚂蚁模式的第二阶段是服务生态系统。陈亮说:“它是根据支付宝的生态系统来做的。”

支付宝有很多小程序。有很多开发者为支付宝开发小程序,很多服务商也为支付宝开发小程序。蚂蚁的AI代码工具在服务自身业务的同时,也可以服务生态开发者,加速B端业务落地,壮大自身生态。

支付宝的AI表单

除了服务代码之外,围绕蚂蚁生态还有很多服务于不同行业的垂直模式,比如租赁、房产的大模式,挂号、医疗的大模式,还有出行、法律、民生等领域的大模式。字段。 。

如果说垂直模式是蚂蚁AI的第二阶段,那么下一阶段可能就是新一代交互界面的探索,尝试从GUI(User,图形用户界面)转向LUI(UI)。

其实,这次五福节的AI不仅仅包括“表喜小剧场”、“会说话的红包”、“时空照相馆”和“大家来找福”,这几个AI迷你游戏。五福节的“智能助手”其实是基于百灵大模型打造的一个比较完整的AI对话产品。

虽然“智能助手”等功能距离吕还很遥远,但陈亮也看到了希望。 “过去,我们根本无法考虑基于对话来调用函数。现在我们有了大型模型,大家认为还是可以做到的。”陈亮认为,目前AI技术面临的挑战主要是提高准确率。过去依靠复杂、可行性低的模板来调用函数,不仅难以保持高精度,而且难以维护,导致项目难以为继。大模型技术的引入为LUI提供了更多可能。

AI开发能力和基于大模型的AI将是蚂蚁在AI时代的核心技术竞争力。技术需要了解用户需求,培育用户心智,为技术迭代提供场景。

稳步支撑五福节的蚂蚁AI,或将很快在支付宝迎来更多针对C端场景的AI产品。

分享