北京华网天下

揭秘盲盒秘密！贝壳找房技术总监侯圣文直播数据安全之数据库安全黄金法则

2024-12-29

来源：网络整理

想知道盲盒里的秘密吗？参加今晚8点贝壳找房技术总监侯胜文先生的直播，就有机会领取！

直播主题：《数据安全：数据库安全的黄金法则》

演讲嘉宾：侯胜文，贝壳搜房技术总监

直播时间：2019年11月21日（今晚）20:00

免费注册方式：长按识别下方二维码。

报名今晚直播回答问题

赢取惊喜礼盒

▇ 长按立即识别并注册

出席“大佬来了”第六期直播的嘉宾是百度首席布道师曹宏伟，他分享的主题是“人工智能交互”。

主要讲解了语音交互中使用的AI技术，如ASR、NLU、NLG、TTS等，以及基于这些细分技术构建的面向会话的人工智能操作系统。

通过本次分享，您可以基本掌握如何在智能语音交互平台上开发应用，并进一步了解智能语音如何服务我们的生活。

语音让人机交互更便捷

什么是互动？

交互是指甲、乙之间的一系列动作和行为，出自《经世易传·真》：“真分阴阳，交互作用”。

那么什么是人机交互呢？

人机交互是研究系统与用户之间的交互关系。系统可以是各种机器或计算机化系统和软件。

人机交互重点研究用户和计算机之间的界面，包括人与计算机之间的交互，以及使人类以新颖的方式与计算机交互的设计技术。人机交互和人机界面是两个密切相关但又不同的概念。

计算机时代，人机交互的发展过程如下图所示：

从键盘+鼠标到使用触摸屏，再到语音交互，人机交互在不断演变，从面向机器的人机交互到面向用户的交互。

语音是一种成本非常低廉的通讯方式和工具，给我们带来了极大的便利。

语音交互的优点是：

语音交互离不开人工智能技术。语音交互涉及的人工智能技术如下图所示：

如今，智能语音交互正在为我们服务。其背后有一整套完整的技术和流程，从语音唤醒到自动语音识别，再到自然语言理解，最后通过自然语言生成和语音合成技术进行反馈。整个流程的背后是很多细分的AI技术的支持，比如对话管理、深度学习、DNN、CNN、NLP、TTS等。

面对如此广泛的人工智能技术，我们如何将其应用到工作和生活中？

这类似于我们拥有计算机后的使用方式。计算机上的操作系统及其API为程序员打开了计算机世界的大门。

对于智能交互AI系统，我们也需要一个类似的操作系统来方便高效地构建我们的人工智能交互应用。

语音交互操作系统

百度是一个用于语音交互的对话式人工智能操作系统。它不仅包含了语音交互的全流程，还提供了开放的能力平台，如SDK、工具、编程接口和设备等，如下图所示：

操作系统分为三个层次，即智能设备开放平台（应用层）、对话核心系统（核心层）和技能开放平台（能力层）。

接下来我们将从基于其的智能语音设备的操作系统、智能语音设备的工作原理、智能语音交互的交互流程以及智能语音应用的开发流程等方面进一步了解操作系统。

了解一个操作系统，主要要看有哪些语音设备。基于这些设备，可以打开特定的应用程序。智能语音设备有很多。小度系列部分产品如下：

广泛应用于音箱、电视、冰箱、手机、机器人、车辆、可穿戴设备、玩具等各种场景和设备，这些智能语音设备是如何工作的呢？

与传统设备相比，智能语音设备是交互的，通过语音和触摸屏输入，利用TTS、麦克风、信号处理等手段将本地能力传输到云端，然后使用云端ASR、TTS、NLU、NLG等特定功能AI技术实现智能语音，最终整合业务引擎、业务资源和技能服务，从而可以通过语音完成一系列服务，如下图所示：

技能开放平台包括底层基础能力、BOT-SDK、配置服务、协议开放、平台开放、周边工具等多个层面。下面介绍智能语音交互应用的交互流程。

这里，我们以天气查询意图为例。当用户发出语音命令时，智能音箱本地识别用户的唤醒词，然后通过音箱将语音传输到平台。该平台执行语音识别、语义理解，并将结构化数据发送到技能服务器。。

技能服务器处理请求并向平台返回文本或视觉结果。平台收到后，TTS服务器处理返回的文本，并将广播流发送给智能音箱。如果是带屏幕的音箱，视觉结果也可以在设备上处理。展览。

那么，我们如何开发一款智能语音交互应用呢？

智能语音交互应用的开发流程一般分为六个步骤，分别是注册、创建技能、建立交互模型、编写代码和部署、调试和验证、技能上线商用。具体步骤如下图所示。

第一步是参观并登记。

访问并注册为开发人员。

第二步是创造技能。

这与我们在 iOS 上创建应用程序的方式类似。

进入技能控制台并选择“从头开始”创建自定义技能。技能名称为2～50个字符，呼叫名称为2～15个字符。

调用名是技能服务的入口，打开+调用名。不建议使用生僻字、中英文混合、数字和汉字混合。技能创建后会生成技能ID，技能ID是技能服务在系统中的唯一标识。

第三步，建立交互模型。

这可能是智能语音应用与App、小程序、Web等应用最大的区别。

用户询问的核心在这里称为意图，而构建交互模型就是创建多个用户意图的过程。

意图的识别相当于具体事件的编号。交互模型的建立实际上是一种面向界面的设计方法。明确的交互意图在一定程度上决定了技能服务的功能。

第四步，编写代码并部署。

提供免费使用高效、安全的百度云服务。开放平台的在线编辑器提供了对Node.js的语言支持。编码主要是对交互模型中的意图进行匹配和处理。

在线编辑器中的代码会自动部署到百度云的CFC中。 CFC是百度云FaaS无服务架构的具体应用。

当然，技能代码也可以用Java、PHP等其他语言编写，也可以部署在自己的服务器或其他云服务上。

第五步，技能服务测试验证。

开放平台提供模拟器和真机调试两种测试方式。真机调试时，请确保技能开发账号与设备登录账号一致。对设备说出“开启技能调试模式”即可开启“技能调试模式”功能。需要注意的是，同时仅支持一项技能测试。

第六部分：技能应用的在线商业利用。

以此类推，发布过程类似于App在市场或苹果商店的发布过程。

至此，我们就可以基于开放平台开发各种满足用户需求的智能语音交互应用了。

同时还提供了一种零编程的智能语音交互应用实现方法。应用类型丰富多彩，可以给我们的生活带来更多的便利和乐趣！

基于智能语音交互服务的生活一天

从早上通过扬声器叫醒你，到通过车载导航出发上班，再到使用小度助手安排当天的工作，小度助手可以提醒你工作时休息，你的孩子也可以使用车载设备可以打电话、看电视和听故事。

随着交互形式的变化，交互技术发展到了如今的智能语音时代。各种人工智能技术可以直接应用于智能语音服务。无需深入关注NLU、NLG等具体的AI技术。只要利用基于此的AI技术的对话式AI开放平台就可以完成语音交互的各种服务。

小程序开发

阅读原文

下一篇：2022年上市公司投资者关系管理工作指引修订背景与主要内容解析

上一篇：企业外购动力费用核算与分配：应付账款科目处理及会计原则详解