HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

语音控制方法及装置、存储介质、智能终端、语音控制系统与流程

2021-01-28 17:01:30|281|起点商标网
语音控制方法及装置、存储介质、智能终端、语音控制系统与流程

本发明涉及语音控制技术领域,尤其涉及一种语音控制方法及装置、存储介质、智能终端、语音控制系统。



背景技术:

目前人工智能(artificialintelligence,ai)语音识别产品应用十分广泛,主要技术方案有以下两种:第1种:人发出语音声波控制-->设备进行语音采集-->再进行语音语义识别-->再转换为操作系统(如android/ios/windows)下的程序语言-->软件应用程序响应,如语音打字、语音翻译转换、导航、播放音乐、设置闹钟、控制其他设备(电视、窗帘、空调、台灯)等;第2种:在智能手机系统(如android/ios)上安装语音识别应用程序(application,app),并将app与智能ai终端设备绑定;辅助手机和智能ai产品通过移动信号或wifi信号接入互联网;用户在远端打开应用app,在app上点击菜单控制,跳过语音分析和语义语言理解模块,直接在辅助机上通过程序发送指令同ai识别产品的程序模块沟通(这种实际上没有经过ai识别模块)。

但是,目前ai识别产品的操控存普遍存在一些缺点和不便,第1种技术方案需要通过人的说话语音声音声波控制,其缺点有:i.只能近距离发送语音指令(一般不超过10米,中间不能有墙壁隔离);ii.语音会受到周围环境噪音的干扰,识别准确率低。第2种技术方案需要有一个智能辅助手机,其缺点有:i.老人机、固定电话、卫星电话等因为无法安装绑定app,无法控制;ii.一般应用app功能界面逻辑较复杂,老年用户和少儿用户操控不熟悉,时效差;iii.远端无wifi或移动数据流量时,无法实现控制。



技术实现要素:

本发明解决的技术问题是如何实现远程语音控制智能终端产品,实现智能终端产品操控的便捷性。

为解决上述技术问题,本发明实施例提供一种语音控制装置,语音控制装置包括:通信模块,用以接收来自辅助终端的语音请求,并响应于所述语音请求与所述辅助终端建立语音通话通道链路;语音采集模块,耦接所述通信模块,用以通过所述语音通话通道链路采集来自所述辅助终端的语音数据;语音识别模块,耦接所述语音采集模块,用以对所述语音数据进行语音识别,得到语音控制指令。

可选的,所述语音采集模块包括:语音抓取单元,用以直接从所述语音通话通道链路抓取所述语音数据,并通过数据传输接口传输至所述语音识别模块。

可选的,所述语音采集模块包括:录制单元,用以通过麦克风采集扬声器播放的语音信号,所述语音信号的来源是所述语音通话通道链路。

可选的,所述通信模块包括:身份识别单元,用以判断所述辅助终端的身份标识;通信建立单元,用以在所述辅助终端的身份标识为预设身份时,响应于所述语音请求与所述辅助终端建立语音通话通道链路。

可选的,所述语音识别模块对所述语音数据进行语义分析,以得到所述语音控制指令。

可选的,所述通信模块利用蜂窝网络或者ip网络建立所述语音通话通道链路。

为解决上述技术问题,本发明实施例还公开了一种语音控制方法,语音控制方法包括:接收来自辅助终端的语音请求,并响应于所述语音请求与所述辅助终端建立语音通话通道链路;通过所述语音通话通道链路采集来自所述辅助终端的语音数据;对所述语音数据进行语音识别,得到语音控制指令。

可选的,所述通过所述语音通话通道链路采集来自所述辅助终端的语音数据包括:直接从所述语音通话通道链路抓取所述语音数据;或者,将所述语音通话通道链路中的语音数据通过扬声器进行播放,并通过麦克风采集所述扬声器播放的语音信号。

本发明实施例还公开了一种存储介质,其上存储有计算机程序,所述计算机程序运行时执行所述语音控制方法的步骤。

本发明实施例还公开了一种智能终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行所述语音控制方法的步骤。

本发明实施例还公开了一种语音控制系统,语音控制系统包括:语音控制装置;辅助终端,用以向所述语音控制装置发送语音请求,以建立语音通话通道链路。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

本发明技术方案中,智能终端产品通过通信模块与辅助终端建立语音通话通道链路,通过语音采集模块采集语音通话通道链路中的语音信号,通过语音识别模块对抓取到的语音数据识别得到语音控制指令,以控制智能终端执行相应的操作。本发明技术方案结合通信模块和语音采集模块,可以实现对辅助终端语音的捕获,进而可以利用来自辅助终端的语音实现对智能终端的控制;由于辅助终端与智能终端之间是通过建立语音通话通道链路来交互的,语音通话通道链路对两者的距离没有限制,因此能够实现对智能终端的远程语音控制,相较于远程通过app来控制智能终端,对辅助终端以及辅助终端用户的要求均降低,提升了用户对智能终端控制的使用体验。

附图说明

图1是本发明实施例一种语音控制装置的结构示意图;

图2是本发明实施例一种具体应用场景的示意图;

图3是本发明实施例另一种具体应用场景的示意图;

图4是本发明实施例一种语音控制方法的示意图。

具体实施方式

如背景技术中所述,目前ai识别产品的操控存普遍存在一些缺点和不便,第1种技术方案需要通过人的说话语音声音声波控制,其缺点有:i.只能近距离发送语音指令(一般不超过10米,中间不能有墙壁隔离);ii.语音会受到周围环境噪音的干扰,识别准确率低。第2种技术方案需要有一个智能辅助手机,其缺点有:i.老人机、固定电话、卫星电话等因为无法安装绑定app,无法控制;ii.一般应用app功能界面逻辑较复杂,老年用户和少儿用户操控不熟悉,时效差;iii.远端无wifi或移动数据流量时,无法实现控制。

本发明技术方案结合通信模块和语音采集模块,可以实现对辅助终端语音的捕获,进而可以利用来自辅助终端的语音实现对智能终端的控制;由于辅助终端与智能终端之间是通过建立语音通话通道链路来交互的,语音通话通道链路对两者的距离没有限制,因此能够实现对智能终端的远程语音控制,相较于远程通过app来控制智能终端,对辅助终端以及辅助终端用户的要求均降低,提升了用户对智能终端控制的使用体验。

为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例一种语音控制装置的结构示意图。

图1所示语音控制装置10可以用于智能终端产品,例如,智能手机、智能音箱、智能车载设备等。

本实施例中,语音控制装置10可以包括通信模块101、语音采集模块102和语音识别模块103。

其中,通信模块101用以接收来自辅助终端的语音请求,并响应于所述语音请求与所述辅助终端建立语音通话通道链路;

语音采集模块102耦接所述通信模块101,用以通过所述语音通话通道链路采集来自所述辅助终端的语音数据;

语音识别模块103耦接所述语音采集模块102,用以对所述语音数据进行语音识别,得到语音控制指令。

具体实施中,智能终端产品集成有通信模块101。通信模块101具有通信功能,智能终端可以通过通信模块101与辅助终端20建立通信,也即建立语音通话通道链路。由此,通信模块101可以经由语音通话通道链路接收来自辅助终端20的语音信号。

具体地,通信模块101可以与其他设备建立通信联系,例如建立电话联系。在一个具体实施例中,所述通信模块101利用蜂窝网络或者ip网络建立所述语音通话通道链路。

辅助终端20可以是功能手机、智能手机、固定电话、卫星电话等任意具备通信功能的设备,本发明实施例对此不作限制。

通信模块101可以是现有的智能终端具有的功能模块,现有技术中通常是仅利用通话模块101来进行通信交互,而本发明实施例是利用了通信模块101能够执行远程通话的功能,进而结合语音采集模块102的录音功能来实现远程语音控制的。

具体实施中,语音采集模块102可以采集并录制下行语音信号,也即来自辅助终端20的语音数据,并将录制的语音数据发送给语音识别模块103。具体而言,语音采集模块102可以是能够录制下行电话语音的程序代码。语音采集模块102可以通过数据传输接口来传输语音数据。

具体地,数据传输接口可以是音频接口,用来传输音频数据。数据传输接口可以设置于语音采集模块102。

进一步而言,语音采集模块102可以将语音数据传输至语音识别模块103的音频接口或者应用程序接口(applicationprogramminginterface,api)。

在一个具体的实施例中,语音采集模块102可以是从智能终端内部的数据dump中来捕获语音数据的。

具体而言,语音识别模块103可以是内置于智能终端内部的语音识别系统,其可以对语音数据执行语义分析的操作。语音识别模块103通过语音数据获得语音指令,智能终端能够响应于所述语音控制指令执行相应的操作,例如,语音打字、语音翻译转换、导航、播放音乐、设置闹钟、控制其他设备(电视、窗帘、空调、台灯)等。

需要说明的是,关于语音识别模块103的具体功能,可以包括语义分析、语言理解等,也可以包括其他任意可实施的业务功能,具体可参照现有技术,本发明实施例对此不作限制。

本发明实施例结合通信模块和语音采集模块,可以实现对辅助终端语音的捕获,进而可以利用来自辅助终端的语音实现对智能终端的控制;由于辅助终端与智能终端之间是通过建立语音通话通道链路来交互的,语音通话通道链路对两者的距离没有限制,因此能够实现对智能终端的远程语音控制,相较于远程通过app来控制智能终端,对辅助终端以及辅助终端用户的要求均降低,提升了用户对智能终端控制的使用体验。

在一个非限制性的实施例中,请参照图2,语音采集模块102可以包括:语音抓取单元1021,用以直接从所述语音通话通道链路抓取所述语音数据,并通过数据传输接口传输至所述语音识别模块。

本实施例中,语音抓取单元是直接从通信模块101与辅助终端建立的语音通话通道链路中抓取下行语音信号的,相较于现有技术中通过麦克风近距离获取用户语音而言,可以使得获取到的语音数据中的噪音较少,有助于提升后续语音识别的准确性。

语音抓取单元1021可以从下行语音链路,也即语音通话通道链路中捕获语音信号;具体可以是从内存dump中捕获语音信号,并传输至后续的语音识别模块103。

在一个非限制性的实施例中,请参照图3,语音采集模块102可以包括:录制单元1022,用以通过麦克风抓取扬声器播放的语音信号。

与前述实施例不同的是,本实施例不需要在智能终端产品中额外内置任何软件或硬件,而是直接复用智能终端产品的扬声器和麦克风。具体可以是先控制扬声器播放语音通话通道链路中的语音数据,再通过麦克风抓取扬声器播放的语音信号,并作为语音数据传输给语音识别模块。

本领域技术人员可以理解的是,一旦辅助终端与智能终端建立语音通话,扬声器和麦克风即被该语音通话占用,从而可以实现语音的播放和录制。

进一步而言,录制单元1022具有较高的占用优先级,也即,在所述语音通话通道链路建立完成后,语音通话通道链路优先占用麦克风,此时麦克风将不再采集其他语音数据,例如近距离的语音。当语音通话通道链路释放麦克风后,麦克风能够采集近距离的语音,此时用户可以通过麦克风近距离控制智能ai设备。

在一个具体实施例中,通信模块101可以包括:身份识别单元(图未示),用以在接收到所述语音请求后,判断所述辅助终端的身份标识;通信建立单元(图未示),用以在所述辅助终端的身份标识为预设身份时,响应于所述语音请求与所述辅助终端建立语音通话通道链路。

本实施例中,为了保证对智能终端控制的安全性,通信模块101可以选择性地与辅助终端20建立通信。具体可以预先设置通信模块101的自动接听功能,例如设置能够与通信模块101建立通信的辅助终端20的身份标识列表。由此,通信模块在接收到语音请求时,会先验证辅助终端20的身份,例如判断当前辅助终端的身份标识是否存在于上述身份标识列表中,如果存在,表示验证通过,则响应于所述语音请求与所述辅助终端20建立语音通话通道链路;否则,通信模块101将拒绝该语音请求。

在一个具体实施例中,图1所示语音控制装置10还可以包括识别控制模块(图未示),用以在所述语音采集模块抓取到所述语音数据时,禁止语音抓取设备抓取其他语音信号。

本实施例中,由于语音采集模块102可以从语音通话通道链路中抓取语音数据,而智能终端产品本身具有语音抓取设备,例如麦克风,其可以抓取近距离的语音数据。为了避免多路语音产生干扰,可以在抓取到其中一路语音时,如语音采集模块102抓取到来自辅助终端的语音数据时,可以禁止语音抓取设备抓取上述语音数据之外的其他语音信号。

可以理解的是,在具体实现中,识别控制模块可以是程序代码的形式,可以内置于智能终端产品中。

请参照图4,本发明实施例的语音控制方法可以包括以下步骤:

步骤s301:接收来自辅助终端的语音请求,并响应于所述语音请求与所述辅助终端建立语音通话通道链路;

步骤s302:通过所述语音通话通道链路采集来自所述辅助终端的语音数据;

步骤s303:对所述语音数据进行语音识别,得到语音控制指令。

需要指出的是,本实施例中各个步骤的序号并不代表对各个步骤的执行顺序的限定。

本实施例的语音控制方法可以用于能够执行语音控制操作的智能终端产品侧,例如智能手机、智能音箱、智能车载设备等。

本发明实施例可以实现远端在任何地点位置,通过移动电话或网络电话发送语音指令给智能终端。智能终端通过录音程序将声音指令直接发送至语音识别的数据传输接口,从而实现相关语音控制操作(如播放音乐、呼叫电话、控制智能家居产品启动等)。

具体实施中,步骤s302可以包括以下步骤:直接从所述语音通话通道链路抓取所述语音数据;或者,将所述语音通话通道链路中的语音数据通过扬声器进行播放,并通过麦克风抓取所述扬声器播放的语音信号。

通过直接抓取语音数据的方式,可以使得获取到的语音数据中的噪音较少,有助于提升后续语音识别的准确性。复用智能终端产品的扬声器和麦克风的方式则可以减小智能终端的软件或硬件成本。

关于所述语音控制方法的工作原理、工作方式的更多内容,可以参照图1至图3中的相关描述,这里不再赘述。

继续参照图1,本发明实施例的语音控制系统可以包括语音控制装置10和辅助终端20。其中,语音控制装置10可以内部集成或外部耦接于智能终端中。

本实施例中,用户能够不受距离的限制,通过辅助终端20与语音控制装置10建立通信,利用语音来控制该语音控制装置10,或者通过语音控制装置10控制其他智能终端设备。

在一个具体的应用场景中,智能终端为受控ai智能产品,辅助终端为辅助机。

在受控ai智能产品端先设置好自动接听电话功能。用户通过辅助机拨打电话给受控ai智能产品,受控ai智能产品自动接听后建立语音联系。用户可以说出需要受控ai智能产品要做到事,如“打开窗帘”、“开始煮饭”、“起床闹钟”、“播放音乐”等。

受控ai智能产品的通信模块接收用户语音指令。受控ai智能产品录音程序录制抓取对端(下行)语音指令,直接送给受控ai智能产品的语音识别模块的数据传输接口,再由受控ai智能产品的识别控制模块完成相关的控制。

本发明实施例还公开了一种存储介质,所述存储介质为计算机可读存储介质,其上存储有计算机程序,所述计算机程序运行时可以执行图4中所示的语音控制方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。

本发明实施例还公开了一种智能终端,所述智能终端可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序。所述处理器运行所述计算机程序时可以执行图4中所示的语音控制方法的步骤。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips