语音交互系统的制作方法
本申请涉及家用电器领域,特别涉及一种语音交互系统。
背景技术:
随着智能家居的普及,家庭中的智能设备会越来越多,然而家庭内的智能设备厂家品牌繁多,不同品牌的设备间往往采用不同的通信协议,使得不同品牌的智能设备很难进行相互的通信或交互,用户体验较差。
技术实现要素:
本申请的实施方式提供一种语音交互系统。
本申请实施方式的语音交互系统,包括均具有语音识别功能的第一设备和第二设备,其中,所述第一设备用于向第二设备发送第一语音控制指令,所述第二设备用于接收所述第一语音控制指令并根据所述第一语音控制指令执行预定操作。
在某些实施方式中,所述第一控制指令包括第一唤醒指令,所述第一语音控制指令包括第一语音唤醒指令,所述第一语音转换模块用于将所述第一唤醒指令转换为所述第一语音唤醒指令,所述第一语音输出模块用于播放所述第一语音唤醒指令,所述第二设备通过所述第二语音接收模块接收所述第一语音唤醒指令以唤醒所述第二设备。
在某些实施方式中,所述第二设备包括第二语音识别模块,所述第二语音识别模块用于识别接收到的所述第一语音唤醒指令以唤醒所述第二设备。
在某些实施方式中,其特征在于,所述第一控制指令包括第一操作指令,所述第一语音控制指令包括第一语音操作指令,所述第一语音转换模块用于将所述第一操作指令转换为所述第一语音操作指令,在所述第二设备被唤醒后,所述第一设备通过所述第一语音输出模块播放所述第一语音操作指令,所述第二设备通过所述第二语音设备接收模块接收所述第一语音操作指令以执行预定操作。
在某些实施方式中,所述第二设备包括第二语音识别模块,所述第二语音识别模块用于识别接收到的第一语音唤醒指令以唤醒所述第二设备。
在某些实施方式中,所述第二设备还包括第二语义识别模块和第二控制模块;
所述第二语音识别模块还用于识别接收到的所述第一语音操作指令的指令内容;
所述第二语义识别模块用于对所述第一语音操作指令的指令内容进行语义解析以生成执行指令;
所述第二控制模块根据所述执行指令控制所述第二设备执行预定操作。
在某些实施方式中,所述第二设备包括第二语音转化模块和第二语音输出模块,所述第二语音转化模块用于在所述第二设备开始执行所述预定操作后生成反馈信息并将所述反馈信息转化为语音反馈指令,所述第二语音输出模块用于播放所述语音反馈指令。
在某些实施方式中,所述第一设备还包括第一语音接收模块、第一语音识别模块、第一语义识别模块和第一控制模块,所述第一语音接收模块用于接收所述语音反馈指令,所述第一语音识别模块用于识别所述语音反馈指令的指令内容,所述第一语义识别模块用于对所述语音反馈指令的指令内容进行语义解析以生成确认指令,所述第一控制模块根据所述确认指令确认所述第二设备执行所述预定操作。
在某些实施方式中,所述第一设备用于检测环境参数,并根据所述环境参数生成所述第一控制指令。
在某些实施方式中,所述第二设备还用于向所述第一设备发送第二语音控制指令,所述第一设备还用于接收所述第二语音指令并根据所述第二语音指令执行预定操作。
本申请实施方式的语音交互系统中,均具有语音识别功能的第一设备与第二设备之间可通过语音方式实现交互以执行相关的控制命令,设备之间的交互可跨品牌实施且无需统一通信协议标准,交互应用范围广泛,用户体验较佳。
本申请的附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本申请实施方式的语音交互系统的方框示意图;
图2是本申请实施方式的语音交互系统的又一方框示意图;
图3是本申请实施方式的语音交互系统的交互场景示意图;
图4是本申请实施方式的语音交互系统的交互流程示意图。
具体实施方式
下面详细描述本申请的实施方式,所述实施方式的示例在附图中示出,其中相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本申请的实施方式,而不能理解为对本申请的实施方式的限制。
请参阅图1,本申请实施方式的语音交互系统1000,包括第一设备100和第二设备200。第一设备100和第二设备200均支持语音控制,或者说具有语音识别功能。第一设备100用于向第二设备200发送第一语音控制指令,第二设备200用于接收第一语音控制指令并根据第一语音指令执行预定操作。
随着智能家居的普及,用户家庭中的智能设备越来越多,然而家庭内的智能设备厂家品牌繁多,不同品牌的设备间往往采用不同的通信协议,使得不同品牌的智能设备很难进行相互的通信或交互。抑或,多个智能设备需要通过路由器等网络设备连接至同一局域网,各设备间的交互需要依赖网络进行。
本申请实施方式的语音交互系统1000中,均具有语音识别功能的第一设备100与第二设备200之间可通过语音方式实现交互以执行相关的控制命令,设备之间的交互可跨品牌实施且无需统一通信协议标准,交互应用范围广泛,用户体验较佳。
具体地,第一设备100和第二设备200均可作为指令发出方,也可作为指令接收方,也即是说,在第一设备100发出第一语音控制指令时,第二设备200用于接收该第一语音控制指令。反之,在第二设备200发出第二语音控制指令时,第一设备200用于接收该第二语音控制指令。
语音交互系统1000中的设备并不限于仅包括第一设备100和第二设备200,随着设备数量的增多,语音交互系统1000还可包括第三设备、第四设备等。
第一设备100和第二设备200可以是任一具有语音识别功能的家用电器,例如具有语音识别功能的电视、冰箱、洗衣机、空调、燃气灶、抽油烟机、热水器、电饭煲、烤箱、洗碗机等。
请一并参阅图2-4,在某些实施方式中,第一设备100包括第一语音转换模块110和第一语音输出模块111。第一语音转换模块110用于将第一控制指令转换为第一语音控制指令,第一语音输出模块111用于播放第一语音控制指令。第二设备200包括第二语音接收模块212。第二设备200通过第二语音接收模块212接收第一语音控制指令。
具体地,第一语音转换模块110可以是tts文本转语音模块,从而可以将第一控制指令由文字转化为语音形式也即是第一语音控制指令。第一语音输出模块111可以是扬声器,用于将转换后的第一语音控制指令通过扬声器播放。
第二语音接收模块212可以是麦克风,用于接收第一语音控制指令,以使得第二装置200可以根据第一语音控制指令执行预定操作。
在这样的实施方式中,第一控制指令包括第一唤醒指令,第一语音控制指令包括第一语音唤醒指令,第一语音转换模块110用于将第一唤醒指令转换为第一语音唤醒指令,第一语音输出模块111用于播放第一语音唤醒指令,第二设备200通过第二语音接收模块212接收第一语音唤醒指令以唤醒第二设备200。
可以理解,在由诸多设备组成的交互系统中,在第一设备100对第二设备200下达控制指令时,需要让第一设备100明确控制的目标即第二设备200,同时需要使第二设备200获知自己是被控目标。第一设备100的存储器中存储用于唤醒其他设备的唤醒指令,唤醒指令可以是品牌设备名称,例如“品牌a设备a”,也可以是设备动作指令例如“设备a请开启”。一般地,唤醒指令以文本形式存储,第一设备100通过第一语音转换模块110转换成语音,并通过第一语音输出模块111播放经转换后的唤醒指令。第二设备200在接收到第一语音唤醒指令后被唤醒。
设备可具有休眠和工作状态,在设备不工作时,设备处于休眠状态,此状态下,仅语音接收模块保持工作,其他功能模块处于休眠状态,也即是非工作状态,设备可始终接收来自外部的语音指令,当确定对应唤醒本机的语音唤醒指令时,本机由休眠状态被唤醒进入工作状态。
此处的工作状态应当广义理解为既包括设备在执行具体操作指令执行相关操作的状态,也包括设备处于上电状态可以执行但未执行相关操作的状态。
进一步地,第二设备200包括第二语音识别模块213,第二语音识别模块213用于识别接收到的第一语音唤醒指令以唤醒第二设备200。
具体地,第二语音识别模块213可以是自动语音识别(automaticspeechrecognition,asr)模块。asr模块用于将声音转化为文本。可以理解,第二语音接收模块212用于接收来自外部的或者其他设备的语音指令,在接收后需要明确是否对本机的唤醒指令,例如在一个交互系统中包括两个以上的设备,其中一个设备发出语音唤醒指令,其他设备均可接收到该语音唤醒指令,并通过各自的语音识别模块对该语音唤醒指令进行识别以判断是否是对本机的唤醒。
进一步地,在这样的实施方式中,第一控制指令还包括第一操作指令。第一语音控制指令包括第一语音操作指令。第一语音转换模块110用于将第一操作指令转换为第一语音操作指令。
具体地,与将第一唤醒指令转换为第一语音唤醒指令相类似,第一语音转换模块110将存储于第一设备100存储器中的第一操作指令由文本形式转化为语音形式的指令,并由第一语音输出模块111播放。第二设备200在被唤醒后明确受控制意图后,将继续通过第二语音接收模块212接收第一语音操作指令。而其他设备由于未被唤醒,因此即便接收第一语音操作指令也将不执行与该指令对应的操作。其中,第一语音操作指令而针对不同设备可独立设置,例如第一语音操作指令可包括对于电饭煲的操作指令,对于电冰箱的操作指令等。操作中,例如当第二设备200加入交互系统后可通过将对应按键的操作指令录入第一设备100的存储器中,从而使得第一设备100中存储有用于控制第二设备的操作指令,并可以通过语音播放操作指令的形式控制第二设备200。反之,第二设备200也可通过相同的过程来实现对第一设备100的语音控制,在此不再赘述。
进一步地,在这种的实施方式中,第二设备200还包括第二语义识别模块214和第二控制模块215。第二语音识别模块213还用于识别接收到的第一语音操作指令的指令内容。
其中,第二语义识别模块214用于对第一语音操作指令的指令内容进行语义解析以生成执行指令。第二控制模块215根据执行指令控制第二设备200执行预定操作。
可以理解地,对于唤醒指令而言,第二设备200只需通过的语音识别模块识别出是在唤醒该设备,使得其他电路部分都上电工作,唤醒指令没有语义,第二设备200也不需要识别指令具体含义,只需要在将唤醒指令转化为文本后,通过对其中关键字、词检测来判断是否是对本设备的唤醒。
而对于操作指令而言,由于其内容繁多复杂,仅仅通过语音识别模块讲语音转化为文字无法实现进一步的操作,设备还需要对转换后文本内容进行语义识别。具体地,第二语义识别模块214可以是自然语言处理(naturallanguageprocessing,nlp)模块,nlp模块用于实现人机间自然语言通信以使得设备能理解自然语言文本的意义,也即是识别第一语音指令操作的指令内容。第二控制模块可以是mcu,用于根据指令内容控制第二设备200执行预定操作。
实际操作中,例如第二设备200是电饭煲,第一语音操作指令是“开始烹饪”,第二语音识别模块213识别出第一语音操作指令的内容文本为“开始烹饪”,第二语义模块215识别出内容文本的语义为开始启动烹饪程序。第二控制模块215控制电饭煲开始启动烹饪的预定操作。
在某些实施方式中,第二设备200还包括第二语音转化模块210和第二语音输出模块211。
其中,第二语音转化模块210除在意图控制其他设备时用于将唤醒指令和操作指令转化为相应的语音指令外,还用于在第二设备200被受控对象时,在接收到第一语音操作指令并执行预定操作后将反馈信息转化为语音反馈指令。
第二语音输出模块211除用于播放经第二语音转化模块210转化的语音指令外,还用于播放上述经第二语音转化模块210转化的语音反馈指令。
具体地,第二语音转换模块210可以是tts文本转语音模块,第二语音输出模块211可以是扬声器。
反馈信息是指第二设备200在开始执行第一操作指令对应的预定操作后,由第二设备200生成并发送给第一设备100第二设备200执行预定操作结果的信息,根据反馈信息,第一设备100可以获知第二设备200是否成功接收并执行相应的控制指令。
在这样的实施方式中,第一设备100还包括第一语音接收模块112、第一语音识别模块113、第一语义识别模块114和第一控制模块115。
第一语音接收模块112用于接收语音反馈指令,第一语音识别模块113用于识别接收到的语音反馈指令的指令内容,第一语义识别模块114用于对语音反馈指令的指令内容进行语义解析以生成确认指令,第一控制模块116根据确认指令确认第二设备200执行预定操作。
与第二设备200识别第一语音操作指令相类似,第一语音接收模块112可以是麦克风,用于接收语音反馈指令,第一语音识别模块113可以是asr模块,用于将接收到语音反馈指令转化为文本,也即是识别语音反馈指令的指令内容。第一语义识别模块114可以是nlp模块,用于识别指令内容的意义,也即是对语音反馈指令的指令内容进行语义解析以生成确认指令,第一控制模块115可以是mcu,用于根据确认指令确认第二设备200已执行预定操作。
实际操作中,例如第二设备200是电饭煲,第一语音操作指令是“开始烹饪”,第二语音识别模块213识别出第一语音操作指令的内容文本为“开始烹饪”,第二语义模块215识别出内容文本的语义为开始启动烹饪程序。第二控制模块215控制电饭煲开始启动烹饪的预定操作。
启动后,第二设备200通过第二语音转化模块210将“已启动烹饪”的文本反馈信息转为语音反馈指令,通过第二语音输出模块211播放该语音反馈指令。第一设备100通过第一语音接收模块112接收“已启动烹饪”的语音反馈指令,第一语音识别模块113对接收到语音识别反馈指令进行识别,识别得到指令内容的文本为“已启动烹饪”,第一语义识别模块114对“已启动烹饪”的文本内容的语义进行解析并生成确认指令,第一控制模块115根据该确认指令确认第二设备200已完成操作。至此,第一设备100与第二设备200之间的语音交互完成。
较佳地,在某些实施方式中,若在预定时间内,第一设备100未接收到反馈信息,则第一设备100每间隔第一时间依顺序发送唤醒指令和操作指令,直至接收到第二设备200发送的反馈信息。若超过预定时间第一设备200仍未接收到反馈信息,则发出报警提示,例如可以是语音提示,也可以是文字等信息发送至用户的移动设备中以提醒用户设备第二设备200可能存在异常。
在某些实施方式中,第一设备100还包括多种传感器以用于检测环境中的相关参数,并根据环境参数生成第一控制指令。
具体地,例如第一设备100中可设置有油烟浓度传感器,用于检测当前环境中的油烟浓度,在当前油烟浓度超过设定标准时,第一设备100可以发送第一控制指令给抽油烟机,控制抽油烟机开启或加大风力。再如,还可以发送第一控制指令给燃气灶,控制燃气灶关闭或调小火力。
需要说明的是,第一设备100可以是任一家用电器,检测环境参数的传感器可根据实际产品的设计需求设置在合适的设备上,在交互系统中,多个设备可以协同工作,分别对不同的环境参数进行检测。例如,对于油烟浓度检测的传感器可以设置在厨房电器中,方便控制抽油烟机或燃气灶。再如,对于环境光检测的传感器可以设备在空调等室内电器中,方便控制顶灯或电视的亮度调节。
在另一些实施方式中,第一控制指令还以是用户通过第一设备100发送给第二设备200。
可以理解地,上述交互过程中,第一设备100和第二设备200并无具体限定,也即是在上述实施方式中,作为控制命令发出的第一设备100在其他实施方式中,还可以是受控的第二设备200。
在这样的实施方式中,第二设备200还用于向第一设备100发送第二语音控制指令,第一设备100还用于接收第二语音指令并根据第二语音指令执行预定操作。
具体交互过程可参见上述各实施方式中相应部分的解释说明,在此不再赘述。
在本申请的实施方式的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请的实施方式和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的实施方式的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的实施方式的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本申请的实施方式的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接或可以相互通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请的实施方式中的具体含义。
在本申请的实施方式中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。
上文的公开提供了许多不同的实施方式或例子用来实现本申请的实施方式的不同结构。为了简化本申请的实施方式的公开,上文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本申请。此外,本申请的实施方式可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本申请的实施方式提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
在本说明书的描述中,参考术语“一个实施方式”、“一些实施方式”、“示意性实施方式”、“示例”、“具体示例”或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的实施方式的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请的各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除