信息流标题生成技术解析:协同抽取与生成方法及关键技术要点

2024-12-24
来源:网络整理

技术思路及主要技术:

1)信息流标题生成:在实际应用中,是通过提取和生成的协同使用来实现的。主要方法是一种面向业务效果的部分工程方法(生成的内容是新增的候选集之一,参与整体排序),另一种是我们正在探索的Copy方法(Copy和概率独立建模) ,重点解决受限情况下的“To”问题。

2大技术要点——在衡量标题创意时,重点对语义+词级方向的点击/转化率进行建模,同时辅以在线E&E选择机制,不断获取标注对,提高在线自动纠错的能力更正;针对局限性,抽象出预处理和质量模型来通用处理文本创意内容的质量控制,并由独立的召回模块负责体验保证。原文在模型结构中独立表示,后期引入进行针对性控制。这将减少“点击诱饵”的概率并提高内容的相关性。

2)商家文案生成:文案生成和标题生成可以使用相同的整体生成模型框架。最大的区别是由文案“商家”的载体决定的。为了保证输出文本的准确性和质量,在输出端需要进行解码控制。第一个是建立一种机制让模型自己学习目标,第二个是在Beam阶段动态添加所需的控制目标。主要有卖点控制、风格控制、多样性控制等控制方式。

其他同类产品概述(营销行业):

营销行业人工智能书写产品主要应用于SEO广告、信息流广告、邮件广告和电商产品介绍等。与信息产品相比,营销产品需要解决内容个性化的问题,实现内容基于地理位置、用户特征、品牌形象的个性化,各种风格的重写文章成为主要方向。这一领域的探索在2018年爆发,但国内研发营销写作产品的主要是阿里巴巴、京东、大众点评、百度等与电商相关的上市互联网公司。百度最初开始结合人工智能技术和大数据开发生成解决方案的工具,但经过两年的尝试,转向辅助信息写作。在国外,第三方广告和技术服务提供商主要负责营销广告工具的研发。这些企业大多已获得投资,并拥有较为完善的盈利模式。

在SEO广告领域,其产品使用户能够针对同一主题生成多篇不同风格的文章。主要模式是原创或重写。除了为有SEO广告和内容营销需求的客户定制服务外,还针对个人用户。提供基于文章销量的收费模式。 Leo的项目专门基于广告系统生成SEO文案。在特定情况下,可以降低单次点击成本30%-42%,提高广告点击率3~10个百分点。除了基本的纠错和预测写作功能外,2018年成立的微思写作还在网站SEO优化、软文推广、自媒体创作等领域开发了重写文章的智能模仿工具。蓝色光标旗下捷宝数据研发的妙笔机器人,可一秒适配数千条新闻稿,保持中心内容不变,根据不同传播渠道的特点改变风格,自动插入相关图片、产品链接、名词解释和延伸阅读。通过搜索引擎的审核标准和判断原则完善内容和结构,适配内容标题与原文相似度极低的SEO稿件,提高稿件在搜索结果中的排名,从而提高访问量到已发表的手稿。还可以监测品牌传播效果,分析内容阅读互动、网站流量、粉丝增长情况,以及用户关注或流失的原因、促进留存和转化的关键点等,并不断调整策略。此外,机器人还可以“挑热点”。舆情机器人会判断新闻的基调是正面还是负面,然后选择是否采纳。然后,它将分析常见的交流点,例如主题分析、匹配图片、名词解释和定义标签。经过分析,喵币推荐与关键信息点相匹配的热点新闻,分析原文内容各段的匹配度,在适当的位置插入热点新闻信息,从而成功“乘势”热度。

专注于解决电子邮件营销优化问题。一键生成数百万种人类语言、符合品牌标准的文本变体。该产品着眼于过去 12 个月内广告创作者使用的所有营销文案的表现,通过 NLG 处理技术查看数千种语言特征。它的神经网络知道广告受众对情感、风格和词汇的组合有何反应,从而识别出能够带来更好结果的个人策略。该公司通过“定制语言模型”来适应特定品牌的形象,以确保文本和品牌形象相关,并支持多语言生成。主要行业包括零售、旅游和度假村、电信和金融服务。三年来,人工智能生成的营销活动电子邮件主题行的表现始终优于人工编写的主题行。电子邮件营销渠道收入大幅增长,相当于数百万英镑。在网站上使用时,点击次数增加了 35%-50%,帮助点击率提高了 26%,帮助降低了人均成本 31%,帮助实现了惊人的 753% 的投资回报率,该公司之前实现了使用人工智能生成的电子邮件主题行,电子邮件打开率提高了 57%。近期,该公司推出了信息流模型的新工具。

主要专注于网络广告。已开展 4,000 个活动,平均转化率提高 49.5%。他们利用了世界上最全面的营销语言知识库,其中包含 25 种语言的超过 100 万个标记和评级的单词、短语和图像。通过将文字与数据相结合,营销理念被分解为六个关键要素,然后对数千种潜在的信息组合进行实验,以生成效果最佳的内容。它可以生成25种语言的AI驱动的广告素材、情感语言个性化、品牌定制、广告分发平台定制、风格定制、付费社交广告即时文本和图像生成、用户情感洞察和反应数据以及广告效果报告。广告管理,涵盖金融服务、旅游和酒店、电信技术和消费者服务等行业。目前用户超过250人,平均点击率提升68%,平均转化率提升76%。目前已筹集6600万美元融资。

京东和阿里巴巴在文案方面的尝试都集中在各自电商平台的产品文案优化上,试图通过为内部商家提供高效、优质的智能文案来降低商家的创意成本,提高平台内容的质量。京东开发了李白书写和莎士比亚两款产品。李白写作可以通过关键词输入,一秒生成数万篇相关文章或素材句子,为电商平台输出高质量的产品功能介绍、详细说明、促销口号、导购文章。 、评论文章等内容打造丰富的营销生态,还可以为信息平台定制不同类型的文章,如快报、评论、知识百科等,还具备写诗的能力。应用于京东找好货买专辑、千人千美等渠道的内容写作。据悉,《李白写作》上线短短几个月,已发表千余篇文章每天引入超万单,为发现好货、买专辑等渠道带来千万级GMV销售额。莎士比亚系统借鉴了传统的NLG和语言模型方法,基于平台自身在产品标签和搜索数据库层面积累的大数据,从句子层面进行结构分析、训练模型和语言生成,从而能够“演讲”一秒钟。 “制作了数千篇文案,可以根据用户的不同需求自由选择各种文案风格。并且可以根据用户的纠正行为,实现机器自身的优化算法。例如,它可以自动“记忆” 2019年,京东整合了此前的两套AI智能文案系统。莎士比亚、李白京东,新增对视频内容智能创作的支持,形成涵盖文案、图像、视频处理等内容创作的综合智能创作平台。

阿里巴巴发布的“AI智能文案”产品成功通过图灵测试。该产品将淘宝、天猫海量优质内容与自然语言算法相结合。主要以产品文案为主,实现了三大核心能力——高度仿真人。撰写文案(提供描述性、特价、搞笑等多种文案风格),自由定义字数,实时在线样例学习。其背后的技术逻辑基于深度神经网络模型,融合注意力机制、位置编码、文案机制等,实现产品文案的顺序生成。具体生成过程是,阿里妈妈的AI智能文案首先从覆盖淘宝几乎所有品类和商品的数亿文案样本中,筛选出数百万个高质量训练样本。然后通过对位置信息进行编码,改变每个单词生成时的概率分布,达到长度可控。最后,结合质量控制模型,拟合人类对生成结果的判断。随着数据的不断积累,质量控制模型对结果的判断将会更加准确,能够更好地指导生成网络的迭代。以最基本的短标题文案为例,阿里妈妈“AI智能文案”的生产能力已达到1秒。

如何获取报告?

本次报告《智能写作:人工智能商业应用的制高点——人工智能技术在智能写作中的应用现状与趋势展望》是机器之心推出的“《智慧周》人工智能技术应用报告系列”之一心产业研究团队。

本系列的所有报告均包含在

访问“ Pro”并获得专业用户认证即可获得免费报告。

PC端访问,体验更佳

分享