HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

大屏幕自动播报内容的语音控制方法及系统与流程

2021-01-28 13:01:12|292|起点商标网
大屏幕自动播报内容的语音控制方法及系统与流程

本发明涉及语音识别技术领域,尤其涉及一种大屏幕自动播报内容的语音控制方法及系统。



背景技术:

随着语音识别技术迅猛发展以及大屏设备的普遍应用,大屏设备搭载语音交互系统也将越来越普遍。进而带动语音交互系统对大屏设备控制技术的发展,以及衍生出控制不同内容的场景落地应用。在许多场所例如企业展厅、监控中心、会展中心等均具有语音播报大屏幕内容以及大屏幕数据智能分析的需求。

目前,现有的控制大屏幕显示方式等功能的包括:先通过采集语音信息转化为字符串,再根据指令集中定义的第一关键字和第二关键字与所述字符串相匹配来获取控制指令,最后再由控制指令来控制大屏幕;或者,通过对比指令与整句话的平均间隔来判断是否为真实指令,从而减少误操作产生。

采用上述两种方法,能对组合的指令进行处理,提高了控制速度,且实现智能化控制和降低错误控制率。但是,大屏幕内会包括众多图表信息以及一些关于数据深层次的分析,这些内容目前是通过人工解读的方式,播报给大屏幕前的用户。从而增加了人力成本,而且人工播报水平参差不齐、界面跳转操作繁琐,不利于用户对大屏幕中所包含繁杂数据的解读,给用户在使用过程中带来较大的局限性。



技术实现要素:

本发明提供的大屏幕自动播报内容的语音控制方法、系统及用户设备,能够通过采集控制大屏幕的命令语音来实现大屏幕内容的自动播报,从而可以简化操作步骤,降低人力成本。

第一方面,本发明提供一种大屏幕自动播报内容的语音控制方法,包括:

语音接收终端接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端;

所述服务端检测所述语音控制指令的类型,若所述语音控制指令为简单动作控制指令,则根据所述简单动作控制指令生成控制信号并发送给显示终端;若所述语音控制指令为复杂语音播报指令,则根据所述复杂语音播报指令确定播报内容,生成音频信号并发送给显示终端;

所述显示终端根据所述服务端发送的控制信号对大屏界面进行切换控制,或者根据所述服务端发送的音频信号进行语音播报和大屏显示。

可选地,在所述语音接收终端接收语音控制指令之前,所述方法还包括:

服务端对大屏应用、主题内容和话术内容进行配置,分别产生带有标识性的唯一编码,所述唯一编码用于将语音指令与播报内容进行关联。

可选地,所述根据所述复杂语音播报指令确定播报内容,生成音频信号包括:根据所述复杂语音播报指令,通过答案唯一编码,利用nlg技术,获得对应播报内容,再对所述播报内容进行语音合成生成音频信号。

可选地,所述根据所述服务端发送的音频信号进行语音播报和大屏显示包括:根据所述音频信号中的唯一编码,确定需要播报的内容,对所述需要播报的内容进行语音播报和大屏显示。

可选地,所述方法还包括:

所述服务端将所述控制信号和/或音频信号按照预定传输协议发送给所述显示终端。

第二方面,本发明提供一种大屏幕自动播报内容的语音控制系统,包括:

语音接收终端,用于接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端;

服务端,用于检测所述语音控制指令的类型,若所述语音控制指令为简单动作控制指令,则根据所述简单动作控制指令生成控制信号并发送给显示终端;若所述语音控制指令为复杂语音播报指令,则根据所述复杂语音播报指令确定播报内容,生成音频信号并发送给显示终端;

显示终端,用于根据所述服务端发送的控制信号对大屏界面进行切换控制,或者根据所述服务端发送的音频信号进行语音播报和大屏显示。

可选地,所述服务端,还用于在所述语音接收终端接收语音控制指令之前,对所述显示终端的大屏应用、主题内容和话术内容进行配置,分别产生带有标识性的唯一编码,所述唯一编码用于将语音指令与播报内容进行关联。

可选地,所述服务端包括:

语义处理模块,用于检测所述语音控制指令的类型,所述语音控制指令的类型包括简单动作控制指令和复杂语音播报指令;

动作指令生成模块,用于在所述语义处理模块检测所述语音控制指令的类型为简单动作控制指令时,对所述简单动作控制指令进行解析,生成控制信号;

语音合成模块,用于在所述语义处理模块检测所述语音控制指令的类型为复杂语音播报指令时,根据所述复杂语音播报指令,通过答案唯一编码,利用nlg技术,获得对应播报内容,再对所述播报内容进行语音合成生成音频信号;

结果集成模块,用于将所述控制信号和/或音频信号按照预定传输协议发送给所述显示终端。

可选地,所述显示终端包括:

终端控制接收器,用于接收服务端发送的控制信号或者音频信号;

大屏数据显示器,与所述终端控制接收器连接,用于根据所述控制信号或者音频信号显示相应的内容;

语音播放器,与所述终端控制接收器连接,用于根据所述音频信号,进行相应的语音播报。

可选地,所述终端控制接收器,用于根据所述音频信号中的唯一编码,确定需要播报的内容,对所述需要播报的内容通过所述语音播放器进行语音播报以及通过所述大屏数据显示器进行显示。

本发明实施例提供的大屏幕自动播报内容的语音控制方法及系统,通过语音交互方式控制大屏幕所要播报的内容,提供数据的智能解读功能,简化繁琐的界面跳转操作步骤,降低数据播报的人工成本;此外,因在服务端已经就大屏应用配置好相应的主题话术内容,通过唯一编码来关联指令信息意图,能够降低语义理解的错误率。

附图说明

图1为本发明一实施例大屏幕自动播报内容的语音控制方法的流程图;

图2为本发明另一实施例大屏幕自动播报内容的语音控制方法的流程图;

图3为本发明一实施例大屏幕自动播报内容的语音控制系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供一种大屏幕自动播报内容的语音控制方法,如图1所示,所述方法包括:

s101、语音接收终端接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端。

s102、所述服务端检测所述语音控制指令的类型,若所述语音控制指令为简单动作控制指令,则根据所述简单动作控制指令生成控制信号并发送给显示终端;若所述语音控制指令为复杂语音播报指令,则根据所述复杂语音播报指令确定播报内容,生成音频信号并发送给显示终端。

s103、所述显示终端根据所述服务端发送的控制信号对大屏界面进行切换控制,或者根据所述服务端发送的音频信号进行语音播报和大屏显示。

本发明实施例提供的大屏幕自动播报内容的语音控制方法,通过语音交互方式控制大屏幕所要播报的内容,提供数据的智能解读功能,简化繁琐的界面跳转操作步骤,降低数据播报的人工成本;此外,因在服务端已经就大屏应用配置好相应的主题话术内容,通过唯一编码来关联指令信息意图,能够降低语义理解的错误率。

下面结合具体实施例对本发明大屏幕自动播报内容的语音控制方法进行详细介绍。

如图2所示,本实施例提供的大屏幕自动播报内容的语音控制方法,包括如下步骤:

s201、显示终端进行初始化,自动完成与服务端的连接。

与服务端连接后的显示终端具有数据同步实现接口,大屏切换接口,能够提供语音播报默认实现功能,且具备连接异常恢复机制。

所述显示终端可以为javascript客户端、安卓客户端、ios客户端或鸿蒙客户端等。

s202、显示终端进行大屏幕可视化模板源码接入,负责控制大屏幕展示界面的编码、语音内容播报和终端控制命令接收。

s203、服务端对大屏应用、主题内容和话术内容进行配置,分别产生带有标识性的唯一编码,所述唯一编码用于将语音指令和播报内容进行关联。

s204、语音接收终端接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端。

具体地,所述语音接收终端可以为声控遥控器、微信小程序等,通过这些交互界面获取语音控制指令,利用已成熟的asr(automaticspeechrecognition,自动语音识别)技术将该语音控制指令中的词汇内容转换为计算机可读的输入文本,例如按键、二进制编码或者字符序列,从而将一段音频转换成文本。

s205、服务端检测通过语音接收终端接收的语音控制指令的类型,若所述语音控制指令为简单动作控制指令,则执行步骤s206-s207;若所述语音控制指令为复杂语音播报指令,则执行步骤s208-s210。

s206、服务端根据所述简单动作控制指令生成控制信号并发送给显示终端。

s207、显示终端根据所述服务端发送的控制信号对大屏界面进行切换控制。

s208、服务端对所述复杂语音播报指令进行自然语言处理,语义理解指令信息意图,并将已在服务端配置好的大屏应用和主题内容,通过答案唯一编码形式关联到已配置好的对应播报内容。

s209、服务端对所述播报内容进行语音合成,生成音频信号发送给显示终端。

s210、显示终端根据所述服务端发送的音频信号进行语音播报和大屏显示。

本发明实施例还提供一种大屏幕自动播报内容的语音控制系统,如图3所示,所述系统包括:

语音接收终端31,用于接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端32;

服务端32,用于检测所述语音控制指令的类型,若所述语音控制指令为简单动作控制指令,则根据所述简单动作控制指令生成控制信号并发送给显示终端33;若所述语音控制指令为复杂语音播报指令,则根据所述复杂语音播报指令确定播报内容,生成音频信号并发送给显示终端33;

显示终端33,用于根据所述服务端32发送的控制信号对大屏界面进行切换控制,或者根据所述服务端32发送的音频信号进行语音播报和大屏显示。

可选地,所述语音接收终端31也可以集成在所述显示终端33中,也就是说,显示终端33也可以接收语音控制指令,并将所述语音控制指令转换为文本格式后发送给服务端32。

本发明实施例提供的大屏幕自动播报内容的语音控制系统,通过语音交互方式控制大屏幕所要播报的内容,提供数据的智能解读功能,简化繁琐的界面跳转操作步骤,降低数据播报的人工成本;此外,因在服务端已经就大屏应用配置好相应的主题话术内容,通过唯一编码来关联指令信息意图,能够降低语义理解的错误率。

可选地,所述服务端32,还用于在所述语音接收终端31接收语音控制指令之前,对所述显示终端的大屏应用、主题内容和话术内容进行配置,分别产生带有标识性的唯一编码,所述唯一编码用于将语音指令与播报内容进行关联。

进一步地,如图3所示,所述服务端32包括:

语义处理模块321,用于检测所述语音控制指令的类型,所述语音控制指令的类型包括简单动作控制指令和复杂语音播报指令;

其中,所述语义处理模块321包含了意图的识别和答复内容的生成,所述答复内容通过nlg(naturallanguagegeneration,自然语言生成)技术确定最终的文本内容。

动作指令生成模块322,用于在所述语义处理模块321检测所述语音控制指令的类型为简单动作控制指令时,对所述简单动作控制指令进行解析,生成控制信号

语音合成模块323,用于在所述语义处理模块321检测所述语音控制指令的类型为复杂语音播报指令时,根据所述复杂语音播报指令,通过答案唯一编码,利用nlg技术,获得对应播报内容,再对所述播报内容进行语音合成生成音频信号;

结果集成模块324,用于将所述控制信号和/或音频信号按照预定传输协议发送给所述显示终端33。

可选地,所述结果集成模块324可以将所述控制信号和/或音频信号按照json格式的传输协议发送给所述显示终端33。

进一步地,如图3所示,所述显示终端33包括:

终端控制接收器331,用于接收服务端32发送的控制信号或者音频信号;

大屏数据显示器332,与所述终端控制接收器221连接,用于根据所述控制信号或者音频信号显示相应的内容;

语音播放器333,与所述终端控制接收器331连接,用于根据所述音频信号,进行相应的语音播报。

可选地,所述终端控制接收器331,用于根据所述音频信号中的唯一编码,确定需要播报的内容,对所述需要播报的内容通过所述语音播放器333进行语音播报以及通过所述大屏数据显示器332进行显示

本实施例的系统,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips