一种语音播报方法公开:降低通信带宽占用,实现音频动态组合优化流畅度

2025-01-27
来源:网络整理

该应用程序披露了语音广播方法,设备,存储介质和计算机设备。语音广播方法包括:生成至少一个语音类型的语音包;将至少一个语音类型的语音软件包发送到智能设备,并将至少一个语音软件包的属性信息发送到商人的末端;商人侧发送的目标语料库和目标语料库的目标语音类型,根据目标语音类型确定目标语料库的目标语料库识别,并确定目标语料库排列的顺序;将目标语料库指令发送到与商人侧相关的智能设备。此应用程序的方法减少了语音广播的通信带宽占用,意识到音频文件的动态组合,更适合不同内容,各种不同语音类型的语音广播,并优化了整体广播的平滑度。优化了整体广播的平滑度。优化了整体广播的平滑度。

所有详细的技术信息下载

[技术实施步骤摘要]

语音广播方法,设备,存储媒体和计算机设备

[0001]此应用程序涉及信息管理

特别是,它涉及语音广播方法,设备,存储介质和计算机设备。

技术简介

[0002]在日常生活和工作中,需要将许多情况报告给数字内容。例如,在交易活动中,商家通常使用构建的手机付款软件 - 插件中的插件,从移动语音广播商人的帐户中收到的金额。

[0003]在相关技术中,扬声器通常使用文本来转换语音(,tts)来执行语音综合和广播,但是这种广播形式需要通过硬件将其刻在扬声器介质中,以便将其雕刻到扬声器介质中,并且根据扬声器的本地语料库到文本到文本TTS处理很容易导致语料库更新不及时的情况,声音的声音相对机械,僵硬,不符合人的语音习惯,并且甚至会影响听众对数字内容数量的理解。它适用于某些方言区域或特殊业务场景。

技术实施

[0004]考虑到这一点,此应用程序提供了语音广播方法,设备,存储介质和计算机设备。通过在批处理中推动各种语音类型的语音类型,可以在本地存储的各种语音类型使用智能设备。该软件包的广播是为了实现高效且流畅的语音广播的目标。

[0005]根据本应用程序的第一个方面,提供了语音广播方法,该方法应用于服务器。此方法包括:

[0006]至少生成一种语音包装的语音类型。其中,语音包包括第一个语料库的发音信息和预设语料库识别;

[0007]将至少一种语音类型的语音包发送到智能设备,以及至少一种语音类型的属性信息属于商家的端;

[0008]如果商人端发送的目标语料库和目标语料库的目标语音类型,请根据目标语音类型确定目标语料库的目标语料库徽标,以及目标语料库标识的顺序;

[0009]将目标语料库指令发送到与商人端相关的智能设备。其中,广播指令带有目标语料库标识和安排顺序,该指令由智能设备根据语音包,目标语料库和目标语音类型的布置顺序确定。目标语料库的音频文件并播放音频文件。

[0010]可选的土地,生成至少一个语音类型的语音包,包括:

[0011]至少获得一种预设语言;

[0012]在至少一个预设尸体中确定第一个语料库;

[0013]显示语音包界面,其中语音软件包接口包含第一个控件;

[0014]响应第一个控件的第一个输入,显示语音包装创建窗口;

[0015]响应语音包创建窗口的第二个输入,获取第一个语音类型;

[0016]根据第一种语音类型,确定第一尸体的发音信息和第一个语料库的预设语料库识别;

[0017]第一个尸体的发音信息和第一个语料库的预设语料库识别获得了第一个语音类型的语音软件包。

[0018]可选土地,至少获得一个预设,包括:

[0019]显示语料库接口。其中,语音包界面包括第二个控件;

[0020]响应第二个控件的第三个输入,显示 窗口;

[0021]响应 窗口的第四个输入以确定预设语料库和默认语料库的类型,因此语料类型包括常规类型和自定义类型。

[0022]可选的土地以确定至少一个预设尸体中的第一个语料库,包括:

[0023]在语音包创建窗口上显示定制类型的预设语料库;

[0024]响应语音包装的创建窗口的第五个输入,请确定第二个尸体。其中,第二个尸体是第五输入的定制类型的预设尸体;

[0025]属于一般类型的预设语料库和/或第二个语料库。

[0026]可选土地,根据第一种语音类型确定第一个语料库的发音信息,包括:

[0027]从第一个语料库的发音信息获得了对应于第一种语音类型的第一种语音类型的发音模型。其中,发音模型是根据音频样本和语料标签训练的。

[0028]根据第一种语音类型,可选土地确定了第一个尸体的预设语料库识别,包括:

[0029]确定与第一个语音类型匹配的第一个字节数组;

[0030]根据第一个语料库的拼音信息确定第二个字节阵列;

[0031]第一个和第二个字节数组阵列是根据预设生产规则处理的,并生成了预设语料库识别。

[0032]可选的土地,语音广播方法还包括:

[0033]如果默认语料库更改,请确定先前语料语音软件包的第二个语音类型;

[0034]与不断变化的语料库相对应的可变发音模型输入第二个语音类型以获取预设语料库的发音信息;

[0035]根据不断变化的语料库的预设语料库更新发音信息。

[0036]可选土地,确定目标语料库安排的顺序,包括:

[0037]确定目标语料库以确定目标尸体中相邻语料库之间的连接序列;

[0038]根据连接顺序配置目标语料库标识的顺序。

[0039]可选的土地,将至少一个语音类型语音包装发送到智能设备,包括:

[0040]显示至少一个语音包的属性信息;

[0041]响应第六个输入,将第六个输入的相应属性信息的语音包发送到智能设备;

[0042]其中,语音类型至少包括一种:语言,速度,声音和音量。

[0043]可选的土地,将至少一个语音类型语音包装发送到智能设备,包括::

[0044]接收商人端发送的第三种语音类型,然后将第三个语音类型的语音包发送到智能设备;

[0045]其中,语音类型至少包括以下一项:语言,速度,声音和音量。

[0046]可选的土地,语音广播方法还包括:

[0047]如果目标语音类型与第三个语音类型不同,则将目标语音类型的语音软件包发送到智能设备。

[0048]根据该应用程序的第二个方面,提供了一种语音广播方法,该方法应用于智能设备。此方法包

包括:

[0049]如果您收到服务器发送的语音包,请存储语音包,其中语音软件包包括第一个尸体的发音信息和预设语料库;

[0050]服务器发送的目标语料库的指令指令;

[0051]执行广播指令,以确定与目标语料库相对应的目标语料库身份的顺序和目标语料库识别;

[0052]根据预设语料库和目标语料库的比较结果,确定目标语料库的发音信息;

[0053]根据安排顺序剪接目标语料库的发音信息,以确定目标语料库的音频文件;

[0054]播放音频文件。

[0055]可选的土地,在确定目标语料库的发音信息后,语音广播方法还包括:

[0056]如果在安排顺序中与相邻目标语料库标识相对应的发音信息属于多种语音类型的多个语音软件包,则与目标尸体中相邻目标语料库相对应的语料库确定为连接语料库;

[0057]根据多种语音类型确定连接语料库的发音校正信息;

[0058]发音信息根据发音校正信息调整了连接语料库。

[0059]根据本应用程序的第三个方面,提供了语音广播方法,该方法应用于商人方面。此方法包括:

[0060]至少一个语音软件包属性信息由服务端发送;

[0061]在第七个输入中负责显示语音配置接口。其中,语音配置接口包括属性信息;

[0062]输入到语音配置接口的第八个输入,确定属性信息中的语音类型类型,与第八输入相对应为目标语音类型;

[0063]获取目标语料库;

[006

【技术保护点】

[技术功能摘要]

1。语音广播方法,其特征是该方法包含:生成至少一个语音类型的语音包,其中语音数据包包括第一个尸体和默认语料库的发音信息;至少一种将至少一种;语音类型的语音软件包已发送到智能设备,并将至少一个语音类型的语音软件包的属性发送到商户端;目标语音类型的类型确定目标语料库的目标语料库识别以及目标语料库识别的排列顺序;将目标语料库的广播说明发送到与商人端相关的智能设备。在其中,广播报告该指令带有目标语料库标识和安排的顺序顺序,对于根据目标语音类型的语音软件包的类型确定目标语料库目标语料库的音频文件,目标语音类型标识和目标的排列顺序,并播放音频文件。 2。根据权利要求1的语音广播方法,其特征是产生至少一种语音类型的语音软件包,包括:获得至少一个预设;确定至少一个预制的语料库。一个语料库;显示语音包界面,其中语音包接口包含第一个控件;为了响应第一个控件的第一个输入,显示了声带创建窗口;为了响应语音包装创建窗口的第一个窗口,要获得第一个语音类型;根据第一种语音类型,确定第一个语料库的发音信息和第一个语料库的预设语料库识别;第一个语料库的预设语料库获得了第一个语音类型的语音软件包。 3。根据权利要求2的语音广播方法,该方法的特征在内,该方法还包括:如果预设语料库更改,请确定与预设语料库相对应的语音数据包的第二种语音类型;在更改后,从预设语料库的发音信息中获得了与预设语料库输入相对应的宣告模型;设置与语料库相对应的人声包。 4。语音广播方法,其特征是该方法,其中包括:如果您收到服务器发送的语音包,请存储语音数据包,其中语音数据包包含第一个语料库的发音信息和默认语料库标识;对服务器发送的目标语料库的广播说明;解析和处理广播指令,以确定与目标语料库相对应的目标语料库的顺序以及目标语料库徽标的布置;目标语料库识别的比较结果确定了目标语料库的发音信息;目标语料库的发音信息被缝合以确定目标语料库的音频文件;并播放了音频文件。 5。以下特征的语音广播方法包括:

至少一个语音软件包属性信息由接收服务端发送;在第七个输入中输入以显示语音配置接口,其中语音配置接口包含属性信息;为了响应语音配置接口的语音配置接口第八个输入,请确定第八个输入属性信息中语音类型作为目标语音类型;获得目标语料库;语音类型的类型根据目标语料库发送到服务端的服务器...

【获得专利的技术特性】

技术研发工作人员:Pang ,Wu ,Sun ,Han ,Wang ,Liu ,

申请(专利权): Co.,Ltd.,

类型:发明

国家省和城市:

所有详细的技术信息下载我是该专利的所有者

分享