字节跳动在AI方面又有大动作。
6月11日,字节跳动集团旗下的火山引擎成功举办了原动力大会。在此次盛会中,字节跳动公司推出了豆包大模型1.6版本以及视频生成模型1.0 pro版等一系列重量级的新产品。
字节跳动公司首席执行官梁汝波通过视频发表讲话强调,人工智能的发展仍处于初级阶段,尚处于马拉松赛事的起步阶段,即前500米。面对由大型AI模型引发的科技革新浪潮,字节跳动公司正努力打造一家卓越的创新型科技公司。
豆包大模型1.6发布
打造三大模型矩阵
在会议中,火山引擎的总裁谭待宣布,火山引擎正式推出了豆包大模型1.6系列,此举旨在进一步提升模型的功能性以及降低服务成本。
火山引擎总裁谭待
据悉,豆包1.6系列目前包含三个不同型号,首先是-seed-1.6,这是一款功能齐全的综合型模型,能够处理长达256K的上下文信息,并具备自适应思考功能(能够自动决定是否启用深度推理);其次是-seed-1.6-强化深度推理版本,它在编码、数学和逻辑方面表现突出,并支持复杂结构的构建;最后是-seed-1.6-极速版,特别适合用于需要实时交互的场景,例如智能客服和语音助手。
据悉,豆包1.6系列模型具备多模态信息解析和图形用户界面操控功能,它能够对现实世界中的问题进行理解和解决。与豆包1.5版本相比,新增的图形界面操控功能使模型拥有了更强的执行能力,例如能够自动浏览网页进行酒店预订,以及识别购物收据并将其整理成表格等。
多项权威测评的结果表明,豆包1.6-在复杂推理、竞赛级数学、多轮对话以及指令遵循等多个测试领域,其成绩已经达到了全球领先水平。
在多模态技能之外,大型模型在视频创作领域同样令人振奋。在会议中,火山引擎推出了其最新的豆包视频生成模型1.0 pro版本,该模型能够实现流畅的多镜头叙事和顺滑的镜头切换,并已被应用于电商广告制作、影视场景设计以及游戏剧情的生成。
依据第三方权威发布的排行榜,豆包视频的生成模型在文本转化为视频以及图像转化为视频这两个关键领域,均显著超过了众多行业内的主流模型。谭待如此评价。
豆包大模型成本降至1/3
推动规模化应用提速
随着人工智能技术的迅猛进步,大规模应用过程中遭遇了众多困难,其中模型成本问题成为了最主要的障碍。
谭待指出,深化思考、实现多模态以及有效运用工具等模型能力的增强,构成了构建的核心要素。此外,每一次任务的执行都会耗费相当资源。唯有降低模型的使用成本,才能有效促进其大规模的应用推广。
据悉,豆包1.6在技术和商业层面实现了创新,引入了“区间定价”机制。该机制将深度思考、多模态处理能力与基础语言模型的价格进行了统一。在用户使用频率最高的0至32K输入区间,豆包1.6的输入费用为每百万次0.8元,输出费用为每百万次8元。这一价格水平仅为豆包1.5深度思考模型或-R1的三分之一,大幅降低了综合成本。
1.0 pro型号价格每千次仅为0.015元,制作一条时长5秒的视频费用仅需3.67元,这在整个行业里是最低的。
字节跳动技术副总裁洪定坤提出,模型能力的不断提升使得AI有望担当起调度者的角色,它能够运用各式各样的工具和资源,实现软件开发的一站式服务,从而显著降低开发难度,提高开发效能。
谭待指出,技术主体已经历了三次时代变迁,而AI时代将引领开发模式和技术结构的整体飞跃。他强调:“在PC时代,主体是网络,移动时代则是应用,而AI时代,主体将具备自主感知、规划与反思的能力,以完成更为复杂的任务。”
字节跳动CEO梁汝波:
AI发展还在马拉松的前500米
豆包大模型市场迄今表现出色,行业应用深度渗透。
据调查,豆包大模型的日平均调用次数在2024年12月达到了4万亿,而在2025年5月这一数字飙升至16.4万亿,年增长幅度超过300%,稳坐中国公有云大模型服务调用次数的榜首位置,市场份额高达46.4%。
企业级应用领域迅速拓宽,AI在搜索、编程、视觉识别等方面的应用需求激增,短短五个月内增长了4.4倍;特别是K12在线教育领域,增长幅度达到了12倍;同时,智能巡检、视频检索等新兴应用场景也实现了日均百亿的突破。
字节跳动公司负责人梁汝波在视频中发表言论,指出人工智能的进步仍处于初级阶段,尚处于这场漫长赛跑的最初500米。在人工智能大型模型推动的技术革新时期,字节跳动不仅要设定更高的标准,仅仅成为一家出色的科技公司是远远不够的,还需努力成为卓越的创新科技公司;前者指的是那些擅长运用先进技术的企业,而后者则致力于探索和创造新技术,这无疑是一项挑战巨大、前景广阔且充满想象力的任务。