语音识别装置、遥控终端、运行控制装置和电器设备的制作方法
本实用新型涉及语音识别领域,具体而言,涉及一种语音识别装置、一种遥控终端、一种运行控制装置、一种电器设备。
背景技术:
相关技术中,电器设备通过存储预先训练的多个语音识别引擎,实现方言等不同语种的语音识别,但是存在以下缺陷:
由于语种较多,因此需要较大的本地存储空间,导致电器设备的制备成本升高。
技术实现要素:
本实用新型旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本实用新型的一个目的在于提供一种语音识别装置。
本实用新型的另一个目的在于提供一种遥控终端。
本实用新型的另一个目的在于提供一种运行控制装置。
本实用新型的另一个目的在于提供一种电器设备。
为了实现上述目的,根据本实用新型的第一方面的技术方案,提供了一种语音识别装置,包括:处理器,用于生成指定语音类型的语音包配置请求;远程通信组件,与处理器电连接,用于将语音包配置请求发送至关联的服务器,并接收服务器反馈的指定语音类型的语音识别数据包;存储器,与处理器电连接,用于存储语音识别数据包;处理器还用于执行计算机指令以执行以下步骤:根据语音识别数据包识别接收到的语音信息。
在该技术方案中,语音识别装置包括处理器、存储器以及远程通信组件,处理器可以根据接收到的触发信息生成语音包配置请求,并通过远程通信组件发送至关联的服务器,服务器能够根据该获取请求向语音识别装置下发指定语音类型的语音识别数据包,存储器用于存储语音识别数据包,存储器与处理器组合,作为语音识别装置,以在接收到语音信息时,通过处理器根据语音识别数据包与语音识别数据包的比较结果,得到识别结果,以实现语音识别过程,一方面,与相关技术相比,本实用新型中的语音识别装置,只需要存储一种满足对用于语义识别需要的语音识别数据包,因此能够减小存储器所需的存储空间,进而减小该语音识别装置的制备成本,另一方面,能够基于不同口音的用户下发匹配的语音识别数据包,在以满足不同用户的语音识别需求。
其中,上述待识别的语音信息可以至少包括以下接收方式:
语音识别装置设置有拾音器,拾音器用于:接收语音信息。
语音识别装置与其它的具有拾音功能的设备进行通信连接,具有拾音功能的设备在获取到语音信息后,发送给语音识别装置进行识别。
另外,指定语音类型的语音识别数据包,可以基于不同地区的方言进行分类,也可以基于不同国家的语言进行分类。
本领域的技术人员能够理解的是,语音识别数据包可以为语音数据库或语义训练模型,通过在服务器存储语音数据库或语义训练模型,在需要时下载到本地,存储于服务器端的语音数据库或语义训练模型可以随时基于信息的语音信息进行更新,因此基于这样的语音识别数据包进行语音识别,能够具有更高的识别精度。
其中,生成指定语音类型的语音包配置请求可以基于获取到的触发信息执行,触发信息可以为语音触发、也可以为触控触发、还可以其它的指定触发信号。
远程通信组件可以为wi-fi模块或蜂窝移动网络模块。
在上述技术方案中,还包括:拾音器,与处理器电连接,用于接收语音请求;处理器还用于执行计算机指令以执行以下步骤:根据对语音请求的解析结果生成语音包配置请求。
在该技术方案中,语音识别装置设置有拾音器,在指定语音类型的语音包的配置阶段,拾音器获取到语音请求,并通过远程通信组件发送至服务器,以实现匹配的语音识别数据包的下载。
其中,可以根据对语音识别数据包的语句种类的解析生成语音请求,也可以为指定语音类型类型的关键词语音生成语音请求。
在上述技术方案中,还包括:触控组件,与处理器电连接,用于接收触控操作;处理器还用于执行计算机指令以执行以下步骤:根据触控操作配置对应的指定语音类型,并生成对应的语音包配置请求。
在该技术方案中,语音识别装置还可以设置有触控组件,为不同类型的语音预设不同的触控操作,以在接收到触控操作后,确定该触控操作对应的所需的语音类型,以基于该语音类型生成对应的语音包配置请求,并将配置请求发送至服务器,以下载匹配的语音识别数据包,通过设置触控组件,能够更准确的获取用户所需的语音识别数据包。
其中,触控组件可以为触摸屏,也可以为按键组件。
在上述技术方案中,还包括:短程通信组件,与处理器电连接,用于接收通过短程传输链路传输的选择指令;处理器还用于执行计算机指令以执行以下步骤:根据选择指令确定指定语音类型,并生成对应的语音包配置请求。
在上述任一技术方案中,短程通信组件包括红外模块、蓝牙模块、近场通信模块、射频识别模块、zigbee模块中的任意一种;或采用远程通信组件作为短程通信组件。
在该技术方案中,短程通信组件具体为短程信号的接收端,比如接收红外信号、蓝牙信号等,以上述信号为载体接收选择指令,语音识别装置还可以直接基于wi-fi、或蜂窝移动网络等传输链路机接收选择执行,比如通过接收遥控终端发送的选择指令,将选择指令作为触发信息,选择指令用于选择所需的语音类型,处理器通过识别选择指令,生成语音种类标识,将该语音种类标识发送至服务器,以下载匹配的语音识别数据包,通过设置短程通信组件,实现与遥控终端之间的信号交互。
在上述任一技术方案中,还包括:交互组件,与处理器电连接,用于反馈语音信息的识别结果。
在该技术方案中,交互组件用于与用户实现交互或与受控的电器设备之间进行交互。
在该技术方案中,语音识别装置还可以设置交互组件,以将对语音信息的识别结果反馈给用户或其它电器设备。
在上述任一技术方案中,交互组件包括扬声器、蜂鸣器以及显示器中的至少一种,扬声器用于播放识别结果,显示器用于显示识别结果,蜂鸣器用于根据不同的蜂鸣频率反馈识别结果对应的控制信息;或交互组件采用短程通信组件配置,短程通信组件用于传输识别结果。
在该技术方案中,交互组件包括扬声器、蜂鸣器以及显示器中的至少一种,结合拾音器,与用户之间实现信息交互,交互组件还可以为短程通信组件,以与受控电器之间实现交互。
具体地,如果交互组件为扬声器,则可以通过扬声器与拾音器的结合实现用户与语音识别装置之间的语音交互,另外,获得的反馈识别结果为通用的语言类型,通过扬声器进行广播还能够实现对指定电器设备的控制。
如果交互组件为蜂鸣器,如果语音信息用于控制电器设备运行,则根据对不同的语音指令识别的结果,生成不同频率的蜂鸣声,电器设备通过对蜂鸣声的频率的解析,解析出对应的控制指令,以基于该控制指令运行。
在上述任一技术方案中,存储器被配置为只存储一种语音识别数据包。
具体地,处理器还用于执行计算机指令以执行以下步骤:若再次获取到语音包配置请求,并检测到语音包配置请求与已存储的语音识别数据包不匹配,则删除已存储的语音识别数据包。
在该技术方案中,还可以将存储器设置为只能存储一种语音识别包,因此如果本地已存储有一种类型的语音识别数据包,如果再次接收到用于配置语音识别数据包的触发信息,则先检测该触发信息对应的语音识别数据包是否为本地存储的数据包,如果不是,则可以先删除已经存储的语音识别数据包,再重新下载语音识别数据包,以实现本地语音识别装置的重新配置。
根据本实用新型的第二方面的技术方案,提供了一种遥控终端,包括:遥控器主体,用于接收选择操作并根据选择操作生成选择指令,和/或接收配置操作并根据配置操作生成语音包配置请求;通信组件,用于向语音识别装置发送选择指令,或向关联的服务器发送语音包配置请求。
在该技术方案中,遥控终端用于向语音识别装置发送选择指令,或直接向服务器发送所需的语音包配置请求,以请求服务器向语音识别装置下发语音识别数据包,从而实现下载与存储一种满足对用于语义识别需要的语音识别数据包。
在这种设置条件下,语音识别装置设置短程通信组件,通过设置短程通信组件,实现与遥控终端之间的信号交互。
根据本实用新型的第三方面的技术方案,还提供了一种运行控制装置,包括:如本实用新型的第一方面的技术方案中任一项所述的语音识别装置,语音识别装置用于根据对语音信息的识别结果生成控制指令;传输组件,传输组件采用语音识别装置中的远程通信组件或近程通信组件配置,或传输组件包括信号传输接口,传输接口用于与受控电器建立有线传输链路,以通过有线传输链路将控制指令发送至受控电器。
在该技术方案中,运行控制装置具体为某一个或多个受控电器的控制端,通过与受控电器之间建立有线传输链路和/或无线传输链路,运行控制装置包括上述的语音识别装置,语音识别装置的识别结果作为控制指令,控制指令通过有线传输链路和/或无线传输链路传输到受控电器,以实现设置有语音识别装置的运行控制装置通过语音信息对受控电器的控制,通过在本地存储器存储指定语音类型的语音识别数据包,实现了指定语音类型的语音对受控终端的控制功能。
在上述技术方案中,指令发送组件为语音识别装置内置的远程通信组件或短程通信组件。
在该技术方案中,指令发送组件至少有三种实现方式:
(1)第一种实现方式,通过传输线缆实现运行控制装置与受控电器之间的连接;
(2)第二种实现方式,通过wi-fi模块实现运行控制装置与受控电器之间的信号传输;
(3)第三种实现方式,通过红外模块、蓝牙模块、近场通信模块、射频识别模块、zigbee模块中的任意一种,使运行控制装置向受控电器发送基于语音信息生成的控制指令。
根据本实用新型的第四方面的技术方案,还提供了一种电器设备,包括:上述第一方面任一技术方案所述的语音识别装置或运行控制装置,语音识别装置用于根据对语音信息的识别结果生成控制指令;家电主体,与语音识别装置电连接,用于根据控制指令运行。
在该技术方案中,电器设备自身设置有语音识别装置,以通过在本地存储器存储指定语音类型的语音识别数据包,实现了通过对指定语音类型的语音的解析,确定对应的控制指令,从而基于该控制指令运行的功能,结合初期对语音识别数据包的配置,能够满足不同口音或者不同语言的语音对电器设备的控制功能。
本实用新型的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本实用新型的实践了解到。
附图说明
本实用新型的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本实用新型的一个实施例的语音识别装置的示意框图;
图2示出了根据本实用新型的另一个实施例的语音识别装置的示意框图;
图3示出了根据本实用新型的另一个实施例的语音识别装置的示意框图;
图4示出了根据本实用新型的另一个实施例的语音识别装置的示意框图;
图5示出了根据本实用新型的另一个实施例的语音识别装置的示意框图;
图6示出了根据本实用新型的一个实施例的语音识别装置的与控制终端的交互示意图;
图7示出了根据本实用新型的一个实施例的运行控制装置的示意框图;
图8示出了根据本实用新型的一个实施例的家电设备的示意框图。
具体实施方式
为了能够更清楚地理解本实用新型的上述目的、特征和优点,下面结合附图和具体实施方式对本实用新型进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本实用新型,但是,本实用新型还可以采用其他不同于在此描述的其他方式来实施,因此,本实用新型的保护范围并不受下面公开的具体实施例的限制。
如图1所示,根据本实用新型的一个实施例的语音识别装置,包括:处理器mcu、远程通信组件104与存储器flash。
其中,处理器mcu,处理器mcu还用于执行计算机指令,具体包括:生成指定语音类型的语音包配置请求。
远程通信组件104,用于将语音包配置请求发送至关联的服务器,并接收服务器反馈的指定语音类型的语音识别数据包。
存储器flash,与处理器电连接,用于存储语音识别数据。
处理器还用于执行计算机指令以执行以下步骤:根据语音识别数据包识别接收到的语音信息。
其中,语音识别装置用于根据获取到的触发信息生成语音包配置请求,远程通信组件104与处理器mcu电连接,用于将语音包配置请求发送至关联的服务器,并接收服务器反馈的指定语音类型的语音识别数据包,存储器flash与处理器mcu电连接,用于存储语音识别数据包;拾音器102与处理器mcu电连接,用于接收待识别的语音信息;处理器mcu还用于执行所述计算机指令以执行以下步骤:根据语音识别数据包识别语音信息。
在该实施例中,语音识别装置包括处理器mcu、存储器flash、远程通信组件104,处理器mcu可以根据接收到的触发信息生成语音包配置请求,并通过远程通信组件104发送至关联的服务器,服务器能够根据该获取请求向语音识别装置下发指定语音类型的语音识别数据包,存储器flash用于存储语音识别数据包,存储器flash与处理器mcu组合,作为语音识别装置,以在接收到语音信息时,通过处理器mcu根据语音识别数据包与语音识别数据包的比较结果,得到识别结果,以实现语音识别过程,一方面,与相关技术相比,本实用新型中的语音识别装置,只需要存储一种满足对用于语义识别需要的语音识别数据包,因此能够减小存储器flash所需的存储空间,进而减小该语音识别装置的制备成本,另一方面,能够基于不同口音的用户下发匹配的语音识别数据包,在以满足不同用户的语音识别需求。
本领域的技术人员能够理解的是,语音识别数据包可以为语音数据库或语义训练模型,通过在服务器存储语音数据库或语义训练模型,在需要时下载到本地,存储于服务器端的语音数据库或语义训练模型可以随时基于信息的语音信息进行更新,因此基于这样的语音识别数据包进行语音识别,能够具有更高的识别精度。
远程通信组件104可以为wi-fi模块或蜂窝移动网络模块。
实施例一
如图2所示,根据本实用新型的一个实施例的语音识别装置10,包括:处理器mcu、远程通信组件(wi-fi)、存储器flash与拾音器102。
拾音器102,与处理器mcu电连接,用于接收语音请求;处理器mcu还用于执行计算机指令以执行以下步骤:根据对语音请求的解析结果生成语音包配置请求。
在该实施例中,语音识别装置设置有拾音器,在指定语音类型的语音包的配置阶段,拾音器获取到语音请求,并通过远程通信组件发送至服务器,以实现匹配的语音识别数据包的下载。
其中,可以根据对语音识别数据包的语句种类的解析生成语音请求,也可以为指定语音类型类型的关键词语音生成语音请求。
拾音器102还用于:接收语音信息,以供处理器mcu基于语音识别数据包对语音信息执行识别操作。
实施例二
如图3所示,根据本实用新型的另一个实施例的语音识别装置10,包括:处理器mcu、远程通信组件、存储器flash、拾音器102与触控组件106,触控组件106与处理器电连接,用于接收触控操作;处理器还用于执行计算机指令以执行以下步骤:根据触控操作配置对应的指定语音类型,并生成对应的语音包配置请求。
在该技术方案中,语音识别装置还可以设置有触控组件,为不同类型的语音预设不同的触控操作,以在接收到触控操作后,确定该触控操作对应的所需的语音类型,以基于该语音类型生成对应的语音包配置请求,并将配置请求发送至服务器,以下载匹配的语音识别数据包,通过设置触控组件106,能够更准确的获取用户所需的语音识别数据包。
其中,触控组件106可以为触摸屏,也可以为按键组件。
实施例三
如图4所示,根据本实用新型的另一个实施例的语音识别装置10,包括:处理器mcu、远程通信组件(wi-fi)、存储器flash、拾音器102与短程通信组件108,短程通信组件108与处理器电连接,用于接收通过短程传输链路传输的选择指令;处理器还用于执行计算机指令以执行以下步骤:根据选择指令确定指定语音类型,并生成对应的语音包配置请求。
在上述任一实施例中,短程通信组件108包括红外模块、蓝牙模块、近场通信模块、射频识别模块、zigbee模块中的任意一种;或采用远程通信组件作为短程通信组件108。
在该实施例中,短程通信组件108具体为短程信号的接收端,语音识别装置10还可以通过接收遥控终端20发送的选择指令,将选择指令作为触发信息,选择指令用于选择所需的语音类型,处理器mcu通过识别选择指令,生成语音种类标识,将该语音种类标识发送至服务器,以下载匹配的语音识别数据包,通过设置短程通信组件108,实现与遥控终端20之间的信号交互。
实施例四
在上述实施例一至实施例三的基础上,语音识别装置10还包括:交互组件。
其中,交互组件包括扬声器110、蜂鸣器以及显示器中的至少一种,其中,扬声器110用于播放识别结果,显示器用于显示识别结果,蜂鸣器用于根据不同的蜂鸣频率反馈识别结果对应的控制信息。
交互组件与处理器mcu电连接,用于反馈语音信息的识别结果。
在该实施例中,语音识别装置10还可以设置交互组件,以将对语音信息的识别结果反馈给用户或其它电器设备。
如图5所示,在该实施例中,如果交互组件为扬声器110,则可以通过扬声器110与拾音器102的结合实现用户与语音识别装置10之间的语音交互,另外,获得的反馈识别结果为通用的语言类型,通过扬声器110进行广播还能够实现对指定电器设备的控制。
如果交互组件为蜂鸣器,如果语音信息用于控制电器设备运行,则根据对不同的语音指令识别的结果,生成不同频率的蜂鸣声,电器设备通过对蜂鸣声的频率的解析,解析出对应的控制指令,以基于该控制指令运行。
另外,交互组件还可以采用短程通信组件配置,短程通信组件用于传输识别结果。
在上述实施例一至实施例四的基础上,将存储器flash配置为只存储一种语音识别数据包的存储方式,处理器mcu还用于执行所述计算机指令以执行以下步骤:若再次获取到触发信息,若检测到语音包配置请求与已存储的语音识别数据包不匹配,则删除删除语音识别数据包。
在该实施例中,还可以将存储器设置为只能存储一种语音识别包,因此如果本地已存储有一种类型的语音识别数据包,如果再次接收到用于配置语音识别数据包的触发信息,则先检测该触发信息对应的语音识别数据包是否为本地存储的数据包,如果不是,则可以先删除已经存储的语音识别数据包,再重新下载语音识别数据包,以实现本地语音识别装置的重新配置。
实施例五
如图6所示,根据本实用新型的实施例的遥控终端20,用于与上述实施例三中限定的语音识别装置10执行信号交互,遥控终端20包括:遥控器主体,用于接收选择操作并根据选择操作生成选择指令,和/或接收配置操作并根据配置操作生成语音包配置请求;通信组件,用于向语音识别装置10发送选择指令,或向关联的服务器发送语音包配置请求。
在该实施例中,遥控终端20用于向语音识别装置10发送选择指令,或直接向服务器发送所需的语音包配置请求,以请求服务器向语音识别装置10下发语音识别数据包,从而实现下载与存储一种满足对用于语义识别需要的语音识别数据包。
如图5所示,在这种设置条件下,语音识别装置10设置短程通信组件108,通过设置短程通信组件108,实现与遥控终端20之间的信号交互。
另外,还可以直接通过wi-fi实现与遥控终端20之间的信号交互。
实施例六
如图7所示,根据本实用新型的实施例的运行控制装置,包括:上述实施例一至实施例四中任一项所描述的语音识别装置10,语音识别装置10用于根据对语音信息的识别结果生成控制指令;传输组件30,传输组件30采用语音识别装置中的远程通信组件或近程通信组件配置,或传输组件包括信号传输接口,传输接口用于与受控电器建立有线传输链路,以通过有线传输链路将控制指令发送至受控电器。
在上述实施例中,传输组件30为语音识别装置10内置的远程通信组件或短程通信组件。
在该实施例中,运行控制装置具体为某一个或多个受控电器的控制端,通过与受控电器之间建立有线传输链路和/或无线传输链路,运行控制装置包括上述的语音识别装置10,语音识别装置10的识别结果作为控制指令,控制指令通过有线传输链路和/或无线传输链路传输到受控电器,以实现设置有语音识别装置10的运行控制装置通过语音信息对受控电器的控制,通过在本地存储器flash存储指定语音类型的语音识别数据包,实现了指定语音类型的语音对受控终端的控制功能。
实施例七
根据本实用新型的实施例的运行控制装置,包括:上述实施例一至实施例四中任一项所描述的语音识别装置10,语音识别装置10用于根据对语音信息的识别结果生成控制指令,语音识别装置10包括wi-fi模块,通过wi-fi模块实现运行控制装置与受控电器之间的信号传输。
实施例八
根据本实用新型的实施例的运行控制装置,包括:上述实施例一至实施例四中任一项所描述的语音识别装置10,语音识别装置10用于根据对语音信息的识别结果生成控制指令,语音识别装置10包括短程通信组件,短程通信组件包括红外模块、蓝牙模块、近场通信模块、射频识别模块、zigbee模块中的任意一种;或采用远程通信组件作为短程通信组件。
实施例九
如图8所示,根据本实用新型的实施例的电器设备,包括:上述实施例一至实施例四中任一项所描述的语音识别装置10,语音识别装置10用于根据对语音信息的识别结果生成控制指令;家电主体40,与语音识别装置10电连接,用于根据控制指令运行。
具体地,家电主体40与语音识别装置10通过传输线缆或实体接口实现运行控制装置与受控电器之间的连接。
在该实施例中,电器设备自身设置有语音识别装置10,以通过在本地存储器flash存储指定语音类型的语音识别数据包,实现了通过对指定语音类型的语音的解析,确定对应的控制指令,从而基于该控制指令运行的功能,结合初期对语音识别数据包的配置,能够满足不同口音或者不同语言的语音对电器设备的控制功能。
以上结合附图详细说明了本实用新型的技术方案,本实用新型的技术方案中至少包括语音识别装置,语音识别装置包括处理器、存储器、远程通信组件以及拾音器,处理器可以根据接收到的触发信息生成语音包配置请求,并通过远程通信组件发送至关联的服务器,服务器能够根据该获取请求向语音识别装置下发指定语音类型的语音识别数据包,存储器用于存储语音识别数据包,存储器与处理器组合,作为语音识别装置,以在接收到语音信息时,通过处理器根据语音识别数据包与语音识别数据包的比较结果,得到识别结果,以实现语音识别过程,一方面,与相关技术相比,本实用新型中的语音识别装置,只需要存储一种满足对用于语义识别需要的语音识别数据包,因此能够减小存储器所需的存储空间,进而减小该语音识别装置的制备成本,另一方面,能够基于不同口音的用户下发匹配的语音识别数据包,在以满足不同用户的语音识别需求。
在本实用新型中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本实用新型中的具体含义。
本实用新型的描述中,需要理解的是,术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本实用新型和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本实用新型的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本实用新型的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本实用新型的优选实施例而已,并不用于限制本实用新型,对于本领域的技术人员来说,本实用新型可以有各种更改和变化。凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除