快手可灵AI 1.5版本内测:画质美感大幅提升,运动笔刷功能助力视频编辑

2025-04-25
来源:网络整理

北京新闻贝克金融公司( Bai )最近在总部元中心举行了 的2024年投资者日活动。 高级副总裁兼主要现场业务和社区科学系列负责人Gai Kun在会议上透露, AI(人工智能)最近正在测试新的1.5版本基本模型,新模型将显着提高图像质量,美学,运动理性和语义响应能力。此外, AI还在内部测试新的 功能,该功能将为用户创建更可控制的视频编辑功能。

今年6月,推出了自我开发的视频生成模型“ AI”,这是世界上第一个可供用户使用的图像级视频生成模型。截至目前, AI为260万用户提供了服务,产生了5300万张图片和2700万个视频。自6月6日发布以来, AI经历了9次迭代和升级。

在会议上,Gai Kun还引入了针对 AI董事的共同创建计划。 9名著名导演,包括李·肖恩(Li ),贾·张(Jia ),叶·吉恩(Ye ),Xue ,Yu ,Dong , ,Wang 和Wang 将依靠 AI的技术能力来制作9个AIGC短片。 Gai Kun说,视频生成模型可以在大约一年内实现电影和电视剧的个人制作的成熟很乐观。

在第二季度,的语言模型也取得了重大的性能提高。目前,在中国场景中,库阿胡的大型模型已经实现了超过GPT-4的全面性能的目标。 Gai Kun说,当前的大型模型布局的核心是在内容理解应用程序的三个方向,大型模型和大型模型的视频生成方面取得关键的突破,并努力在算法,应用和商业模型中实现多方面的创新。在模型培训和投资方面,它倾向于与的现有业务合作,以形成积极的周期。

Gai Kun,高级副总裁兼主要网站业务和社区科学系列负责人。照片|由受访者提供的照片

以语言大型模型的应用,在业务场景中,完整的AIGC(人工智能生成的内容)服务,例如数字人类脚本创意生成,数字人类渲染产生以及基于 Big 建立的数字人类实时互动,可以帮助商业广告商以低成本产生高质量的视频和实时内容。以海地集团为例,在NUWA Live 平台的帮助下,海地的实时广播持续时间从每天的16小时到24小时,每月销售额也每月增加了约200%。

在内容理解和建议方面,可以通过大型语言模型和多模型模型等技术准确有效地了解视频内容和用户兴趣。将这些标签应用于各种情况,例如建议,搜索,广告,垂直操作,生态分析和内容安全性也可以全面提高整个站点的运行效率。

在会议上,高级副总裁兼研发线负责人Yu Bing还引入了基础建筑和技术创新的最新成就。去年投资者当天,Yu Bing提出研发线是航空母舰的基础。经过十多年的积累,它具有丰富而有力的“ ARAM”,以确保稳定的长期业务。今年,Yu Bing审查了这一观点,并介绍了成本治理,研发效率提高,基础设施升级等方面的研发线路的进展。

在成本治理方面,今年已系统地实施了(云成本管理)方法,将其资源成本优化能力推向了前线研发的毛细管,预计将在未来三年内节省该公司的数亿美​​元。在研发效率方面,Yu Bing致力于引入自我发展的AI R&D 。根据报道,整个研发周期中整合AI大型模型功能是具有高内部识别的研发生产力工具。今年6月,图书馆代码的生成率达到18%,这意味着AI生成的所有新代码中几乎五分之一。

在过去的一年中,研发系列推出了自己的音频和视频处理大型型号LPM,该公司是该行业第一家使用大型型号来执行视频增强任务的公司。这项创新技术的推出极大地提高了视频的清晰度,并促进了该应用程序的使用时间大大增加。基于的自我开发的智能视频处理芯片,它支持整个网络上独家4K60帧的“黑色神话:”的实时广播,这可以将代码速率压缩至低于50%的竞争对手,从而呈现出清晰而平稳的体验。

编辑Yang

校对Zhao lin

分享