HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基于智能语音设备的识别控制方法与流程

2021-01-28 17:01:09|312|起点商标网
基于智能语音设备的识别控制方法与流程

本发明属于智能语音设备的识别技术领域,具体涉及一种基于智能语音设备的识别控制方法。



背景技术:

语音识别技术是指让机器通过识别和理解把语音信号转变为相应的文本或命令的高科技技术,广泛应用于工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。随着ai智能语音识别的推广及应用,很多智能设备都具备了ai语音识别功能。

但是当一个固定环境中存在多个设备一起工作进行人机交互时,会存在如下问题:1、由于语音ai识别和ai设备来自多个语音识别服务商,导致同一个语音解析出多个语义结果的现象;2、不同智能设备的精度和算法的不同导致语音识别准确率很低,从而导致智能设备被异常唤醒、播放错误语音、执行异常动作。



技术实现要素:

为了解决上述问题,本发明提供一种基于智能语音设备的识别控制方法,通过多家语音识别服务商均能够处理自身擅长的应用场景和对应的智能语音设备发出的语音文件,从而整体提高语义解析的准确率,更好地控制智能语音设备。

本发明所采用的技术方案是:

一种基于智能语音设备的识别控制方法,其包括如下步骤:

s1、在云平台上预设多家语音识别服务商和其对应的应用场景;

s2、智能语音设备根据选择的所述应用场景,自动上传语音文件到对应的语音识别服务商;

s3、对应的所述语音识别服务商对语音文件进行解析并将解析结果反馈给智能语音设备。

优选地,所述s1具体为:

在云平台上预设多家语音识别服务商的服务地址,以及每个语音识别服务商对应的应用场景。

优选地,所述语音识别服务商的服务地址可修改、删除或增加。

优选地,所述语音识别服务商对应的应用场景均为其擅长的应用场景。

优选地,所述s2具体为:

用户自由选择所述应用场景,智能语音设备根据用户选择的应用场景自动上传语音文件到对应的语音识别服务商。

优选地,所述s3具体为:

对应的所述语音识别服务商接收语音文件,并结合其应用场景对语音文件进行解析,并将解析结果反馈给智能语音设备。

优选地,所述应用场景包括智慧家居场景、智慧办公场景和智慧医疗场景中的一种。

优选地,还包括:

所述智能语音设备为主智能语音设备,所述主智能语音设备根据反馈结果控制其他从智能语音设备。

优选地,所述主智能语音设备和从智能语音设备内设置语音执行模组,以用于统一规范参数。

优选地,所述语音执行模组为多个参数标准相同的麦克风和喇叭,所述参数包括采样频率和音量。

与现有技术相比,本发明的基于智能语音设备的识别控制方法,通过预设多家语音识别服务商和其对应的应用场景,从而使每家语音识别服务商均能够处理自身擅长的应用场景并解析应用场景内的智能语音设备发出的语音文件,整体提高语义解析的准确率,更好地控制智能语音设备。

附图说明

图1是本发明实施例提供的一种基于智能语音设备的识别控制方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供一种基于智能语音设备的识别控制方法,如图1所示,其包括如下步骤:

s1、在云平台上预设多家语音识别服务商和其对应的应用场景;

s2、智能语音设备根据选择的所述应用场景,自动上传语音文件到对应的语音识别服务商;

s3、所述语音识别服务商对语音文件进行解析并将解析结果反馈给智能语音设备。

这样,通过在云平台上预设多家语音识别服务商和其对应的应用场景,从而使选定应用场景后,智能语音设备将语音文件上传到对应的语音识别提供商,对应的语音识别提供商对语音文件进行解析并将解析结果反馈给智能语音设备。

同时,因为每一家所擅长的行业和领域不同,用户可以根据需要选择不同的行业语音识别提供商,例如智慧家居场景选择科大讯飞语音识别提供商,智慧办公场景选择思必驰语音识别提供商,智慧医疗场景选择云知声语音识别提供商等。

所述s1具体为:

在云平台上预设多家语音识别服务商的服务地址,以及每个语音识别服务商对应的应用场景。

这样,通过在与平台上预设多家语音识别服务商的服务地址和其对应的应用场景,以便智能语音设备上传特定应用场景下的语音文件到对应的语音识别服务商。

所述语音识别服务商的服务地址可修改、删除或增加。

这样,即可根据需要修改、删除或增加语音识别服务商和其对应的应用场景。

所述语音识别服务商对应的应用场景均为其擅长的应用场景。

这样,即可使每一家语音识别提服务商均处理其最擅长的应用场景,从而提供语音解析准确率。

所述s2具体为:

用户自由选择所述应用场景,智能语音设备根据用户选择的应用场景自动上传语音文件到对应的语音识别服务商。

这样,用户可以预先自由选择需要的应用场景以适应自身需求,然后应用场景下的智能语音设备即可将接收到的语音文件自动上传到对应的语音识别服务商。

所述s3具体为:

对应的所述语音识别服务商接收语音文件,并结合其应用场景对语音文件进行解析,并将解析结果反馈给智能语音设备。

这样,对应的语音识别服务商接收到智能语音设备上传的语音文件后,即可结合选定的应用场景对语音文件进行解析,并将解析结果反馈回智能语音设备,从而提高语音解析准确度。

所述应用场景包括智慧家居场景、智慧办公场景和智慧医疗场景中的一种。

这样,用户可以根据自身需求选择智慧家居场景、智慧办公场景或智慧医疗场景等多种应用场景,这些应用场景也可以根据时间推移、科技进步,从而进行适应性的修改或增删。

还包括:

所述智能语音设备为主智能语音设备,所述主智能语音设备根据反馈结果控制其他从智能语音设备。

这样,因为将智能语音设备设为主智能语音设备,主智能语音设备按照语音识别服务商提反馈的解析结果,来控制其他从智能语音设备。

所述主智能语音设备和从智能语音设备内设置语音执行模组,以用于统一规范参数。

这样,在主智能语音设备和从智能语音设备内设置统一规范参数的语音执行模组,统一规范智能语音设备内的硬件,从而便于统一管理主智能语音设备和从智能语音设备。

所述语音执行模组为多个参数标准相同的麦克风和喇叭,所述参数包括采样频率和音量。

这样,通过在多个智能语音设备内均设置参数标准相同的麦克风和喇叭,统一规范采样频率和音量,从而便于主智能语音设备对其他从智能语音设备按照相同的硬件参数标准进行统一控制。

本发明的基于智能语音设备的识别控制方法,通过预设多家语音识别服务商和其对应的应用场景,从而使每家语音识别服务商均能够处理自身擅长的应用场景,解析应用场景内的智能语音设备发出的语音文件并进行反馈,整体提高语义解析的准确率,更好地控制智能语音设备。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips