HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种连读识别校正方法、装置、设备以及可读存储介质与流程

2021-01-28 14:01:24|289|起点商标网
一种连读识别校正方法、装置、设备以及可读存储介质与流程

本发明涉及语音技术领域,特别是涉及一种连读识别校正方法、装置、设备以及计算机可读存储介质。



背景技术:

随着科学技术的发展,基于互联网的语言学习应用也得到了快速的发展。在一些语言学习应用中,应用提供商通过互联网将学习材料发送到客户端,用户经由客户端获取学习材料,进行对应的学习。对于语言学习,除了学习语法和词汇之外,发音能力是其中最重要的能力之一。通常情况下,用户会通过朗读、跟读等方式来提升自身的发音能力。然而,多数情况下用户无法得知自身发音是否准确。

采用英文在连贯地说话或朗读时,经常存在连读的情况。一种连读的情况为,在同一个意群(即短语或从句)中,如果相邻的两个词前者以辅音音素结尾,后者以元音音素开头,就要自然地将辅音和元音相拼,构成一个音节的读法。连读时的音节一般不重读,只需顺其自然地一带而过,不可以加音,也不可以读得太重。如:notatall这个短语。连读时听起来就像是一个单词。由于中文中几乎不存在连读的语音现象,因此对部分英语学习者来说,理解和掌握连读的规律较为困难。

传统的方案是通过人工进行现场教学和纠错,在老师的反馈指导下,让学习者通过不断模仿去尽量掌握。但是口语的学习需要不断练习,人工教学和纠错不仅成本高,也使学习者的有效练习受到了时间和空间限制。



技术实现要素:

本发明的目的是提供一种连读识别校正方法、装置、设备以及计算机可读存储介质,以解决传统方法学习成本高、有效练习的时间和空间受到限制的问题。

为解决上述技术问题,本发明提供一种连读识别校正方法,包括:

获取针对预定语句录入的音频数据;

对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;

生成判断实际读音是否正确连读的反馈信息。

可选地,所述对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读包括:

根据所述预定语句的单词发音以及预定的连读规则,筛选出可以连读的单词对;

对筛选得到的单词对插入预定符号构建新的单词,并根据在连读时的发音方式构建对应的音素序列,将新构建的单词发音添加至发音词典中;

对所述音频数据进行分析,根据单词的时间边界截取可以连读的单词对所对应的声学模型输出片段;

将所述声学模型输出片段输入至预先构建的解码网络中,得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果。

可选地,在所述得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果之后还包括:

若判定所述预定语句中可以连读的单词对的实际读音为连读,则进一步判断连读单词是否满足预设要求;

所述生成判断实际读音是否正确连读的反馈信息包括:

如果判定连读单词满足预设要求,则生成判断实际读音正确连读的反馈信息;如果判定连读单词不满足预设要求,则生成判断实际读音未正确连读的反馈信息。

可选地,所述预设要求包括:连读单词的发音分数大于预设第一阈值,和/或连读单词的音素时长小于预设第二阈值。

可选地,在所述筛选出可以连读的单词对之后还包括:

通过显示界面对可以连读的单词对中待连读部分的音标以及字母用第一视觉元素进行标示,以提示连读范围以及连读音素的发音特征。

可选地,在所述生成判断实际读音是否正确连读的反馈信息之后还包括:

通过显示界面的第二视觉元素标示出实际读音是否正确连读。

可选地,在所述生成判断实际读音是否正确连读的反馈信息之后还包括:

通过文字和/或语音的方式对连读的正确发音方式进行提示。

本申请还提供了一种连读识别校正装置,包括:

获取模块,用于获取针对预定语句录入的音频数据;

判断模块,用于对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;

生成模块,用于生成判断实际读音是否正确连读的反馈信息。

本申请还提供了一种连读识别校正设备,应用于服务端,所述设备包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如下步骤:获取针对预定语句录入的音频数据;对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息。

本申请还提供了一种连读识别校正设备,应用于客户端,所述设备包括:

音频采集装置,用于录入针对预定语句的音频数据;

通信装置,用于将所述音频数据发送至服务端,以便所述服务端对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息;并且接收所述服务端发送的反馈信息;

显示装置,用于将所述反馈信息在显示界面上进行显示。

本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种所述连读识别校正方法的步骤。

本发明所提供的连读识别校正方法,通过获取针对预定语句录入的音频数据;对音频数据进行分析,判断预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息。本申请所提供的方法可以自动对录入的音频数据进行分析,检测其中的连读是否正确,得到的反馈信息可以辅助用户理解连读的概念,从而帮助用户有效掌握英语口语中的连读技巧的效果。并且采用本申请不需要再由老师进行当面示范和纠正,因此可以不受学习时间和空间的限制,不仅节约了学习成本,还保证了有效学习的时间。此外,本申请还提供了一种具有上述技术效果的连读识别校正装置、设备以及计算机可读存储介质。

附图说明

为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请所提供的连读识别校正的一种具体实施方式的流程图;

图2为本申请实施例中判断预定语句中可以连续的单词对的实际读音是否正确连读的过程示意图;

图3为本申请所提供的连读识别校正的另一种具体实施方式的流程图;

图4为连读信息展示示意图;

图5为本申请所提供的连读识别校正的又一种具体实施方式的流程图;

图6为反馈用户连读正误的视觉展示形式示意图;

图7为本发明实施例提供的连读识别校正装置的结构框图;

图8为本发明实施例提供的连读识别校正设备应用于服务端的结构框图;

图9为本发明实施例提供的连读识别校正设备应用于客户端的结构框图;

图10为本发明实施例提供的连读识别校正系统的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

本发明实施例可以用于发音学习场景,尤其是语言学习中的发音学习场景或者发音校正场景,其中语言包括但不限于英语、法语、德语、日语等外语,以及普通话、粤语、四川话等汉语分支。本发明实施例涉及的语言学习场景例如可以是语言学习软件或语言学习终端中的发音测评场景、发音校正场景等场景,也可以是其他语言学习场景,本发明实施例中并不限定。

下面对本申请实施例的应用场景进行详细阐述,用户可以通过客户端进行发音学习,客户端可以在显示界面上显示用户待学习的内容,并且还可以通过扬声器等音频播放装置向用户输出语音形式的音频内容。在用户进行语音的发音学习时,客户端可以通过音频采集装置采集用户发音时的音频数据,以便后续进行节奏识别校正操作。可以理解的是,执行节奏识别校正操作的主体可以为客户端,也可以为服务端,这均不影响本申请的实现。

本发明实施例中客户端可以包括但不限于:智能手机、平板电脑、mp4、mp3、pc、pda、可穿戴设备和头戴显示设备等;服务端可以包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算由大量计算机或网络服务器构成的云。

结合上述应用场景,本申请所提供的连读识别校正的一种具体实施方式的流程图如图1所示,该方法具体包括:

步骤s101:获取针对预定语句录入的音频数据;

其中,预定语句包括一个或多个语句,每个语句包括两个及以上单词。本实施例中预定语句可以为需要应用连读技巧的语句。用户可以朗读该预定语句,通过客户端录入针对该待练习语句的语音,经过音频采集装置采集后获得语音对应的音频数据。

步骤s102:对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;

通过对音频数据进行分析,得到预定语句中可以连读的单词对的实际读音,并进一步判断该实际读音是否正确连读。需要指出的是,该过程可以由客户端执行,也可以由后台服务端执行,这均不影响本申请的实现。

步骤s103:生成判断实际读音是否正确连读的反馈信息。

具体地,反馈信息可以通过视觉方式向用户进行直观显示,也可以辅助增加对应的音效进行反馈,在此不做限定。

本发明所提供的连读识别校正方法,通过获取针对预定语句录入的音频数据;对音频数据进行分析,判断预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息。本申请所提供的方法可以自动对录入的音频数据进行分析,检测其中的连读是否正确,得到的反馈信息可以辅助用户理解连读的概念,从而帮助用户有效掌握英语口语中的连读技巧的效果。并且采用本申请不需要再由老师进行当面示范和纠正,因此可以不受学习时间和空间的限制,不仅节约了学习成本,还保证了有效学习的时间。

作为一种具体实施方式,参照图2,上述步骤s102中判断所述预定语句中可以连续的单词对的实际读音是否正确连读的过程可以具体包括:

步骤s1021:根据所述预定语句的单词发音以及预定的连读规则,筛选出可以连读的单词对;

具体地,可以通过遍历预定语句中的相邻单词对,依次检查相邻两个单词是否满足连读规则。连读规则为预设的需要连读的条件信息,例如当检测到“辅音t、d、s、z结尾+单词you”时符合可连读条件,则对应单词对为可以连读的单词对。

步骤s1022:对筛选得到的单词对插入预定符号构建新的单词,并根据在连读时的发音方式构建对应的音素序列,将新构建的单词发音添加至发音词典中;

筛选所得的单词对的中间插入预定符号构建一个新的单词,同时根据其在连读时的发音方式构建对应音素序列,例如预定符号可以为@@,在检测到连读单词对“did”和“you”时,构建新的单词“did@@you”,对应发音/将新构建的单词对应发音添加到语音识别系统的发音词典中。其中,发音词典是构建传统语音识别系统的必要组成部分,识别系统仅会输出存在于发音词典中的单词。发音词典可以为预先构建得到,在连读识别场景中会根据需求向发音词典中添加新构建的单词发音。

步骤s1023:对所述音频数据进行分析,根据单词的时间边界截取可以连读的单词对所对应的声学模型输出片段;

通过语音识别的强制切分对齐,确定每个音素的位置,然后根据每个单词的音节,找到每个音节和单词的时间边界。根据获得的单词的时间边界,截取当前检测连读单词对所对应的声学模型输出片段。

步骤s1024:将所述声学模型输出片段输入至预先构建的解码网络中,得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果。

解码网络为预先构建的只有两条支路的语法网络,其中一条由两个未连读的单词构成,如“did”和“you”,另一条则由对应新添加的表示连读的“单词”构成,如“did@@you”。再与状态转移、上下文、发音规则一同构建解码网络。该解码网络有且仅有表示连读或未连读的两种输出。

将声学模型输出片段输入至构建的解码网络中,进行解码。若解码结果为两个未连读的独立单词,如“didyou”,则表示该音频数据在对应单词对上未进行连读,若解码结果为上文中新加入词典表示连读的“单词”,如“did@@you”,则表示该音频数据在对应单词对上进行了连读。

进一步地,本申请所提供的连读识别校正方法的另一种具体实施方式中,在解码网络确定音频数据在对应单词对上进行了连读之后,还可以进行进一步判断,以进一步提高判断的准确性。该实施例对应的流程图如图3所示,该方法具体包括:

步骤s201:获取针对预定语句录入的音频数据;

步骤s202:根据所述预定语句的单词发音以及预定的连读规则,筛选出可以连读的单词对;

可选地,在所述筛选出可以连读的单词对之后还包括:通过显示界面对可以连读的单词对中待连读部分的音标以及字母用第一视觉元素进行标示,以提示连读范围以及连读音素的发音特征。第一视觉元素可以为弧线。在显示界面显示需要应用连读技巧的句子,其中待连读部分的音标以及对应的字母用弧线进行连接,从视觉上提示连读的范围。同时,在连读部分的音标下方,还可以直接标明连读对应部分的发音情况,辅助用户直观地理解连读时的音素发音特征。

如图4连读信息展示示意图所示,对于预定语句“turnover”,首先检测到二者为可以连读的单词对。在连读部分的字母下方,用弧线来表示需要连读。并且在音标部分直接标明连读部分的发音情况,同时连读部分的音标也用弧线来表示需要连读。

步骤s203:对筛选得到的单词对插入预定符号构建新的单词,并根据在连读时的发音方式构建对应的音素序列,将新构建的单词发音添加至发音词典中;

步骤s204:对所述音频数据进行分析,根据单词的时间边界截取可以连读的单词对所对应的声学模型输出片段;

步骤s205:将所述声学模型输出片段输入至预先构建的解码网络中,得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果;

步骤s206:若判定所述预定语句中可以连读的单词对的实际读音为连读,则进一步判断连读单词是否满足预设要求;

其中,预设要求可以包括:连读单词的发音分数大于预设第一阈值,和/或连读单词的音素时长小于预设第二阈值。

通过预设发音分数计算方法,计算连读单词的发音分数。将得分低于预设第一阈值的语音数据判定为未连读。预设第一阈值为对大量标注数据进行统计分析获得,不同的连读类型对应有不同的预设第一阈值。

一种预设发音分数从计算方法可以为:计算连读单词对应的实际发音数据的后验概率评价指标;计算连读单词对应的实际发音数据的时长评价指标;将所述后验概率评价指标以及所述时长评价指标输入至预先建立的评价模型中,得到所述实际发音数据的发音分数。

其中,计算连读单词对应的实际发音数据的后验概率评价指标的过程可以具体包括:计算每一个音素的似然度得分;将连读单词对应的实际发音数据的似然度得分除以所有音素的似然度得分,得到连读单词对应的实际发音数据的后验概率评价指标。

计算连读单词对应的实际发音数据的时长评价指标的过程可以具体包括:预先在标准发音数据上统计每一个音素的音素时长,通过高斯模型建立表征音素时长与时长评价指标的对应关系;确定连读单词对应的实际发音数据的音素时长;根据高斯模型确定当前音素时长所对应的时长评价指标。

预先建立的评价模型可以为线性回归模型。

连读单词的音素时长可以具体为:连读单词对中前一个单词的末尾音素以及后一个单词的首个音节的时间长度,该时间长度由上文中的音素边界计算获得。将该音素时长低于预设第二阈值的语音数据判为连读,否则判为未连读。该预设第二阈值同样通过对大量标注数据的分析统计获得,不同的连读类型对应有不同的预设第二阈值。

步骤s207:如果判定连读单词满足预设要求,则生成判断实际读音正确连读的反馈信息;如果判定连读单词不满足预设要求,则生成判断实际读音未正确连读的反馈信息。

如图5所示,在上述任一实施例的基础上,本申请所提供的连读识别校正方法在所述生成判断实际读音是否正确连读的反馈信息之后还可以进一步包括:步骤s104:通过视觉元素将反馈信息显示给用户、以辅助用户学习的一系列过程。具体可以为:通过显示界面的第二视觉元素标示出实际读音是否正确连读。例如,在显示界面可以连读的单词对之间通过连线表示连读关系,在进行了正确连读的情况下该连线呈现预设第一颜色。在未进行正确连读的情况下该连线呈现预设第二颜色。预设第一颜色与预设第二颜色为不同的颜色。在未成功连读的情况下,还可以通过连线断开的方式直观进行表示。

参照图6反馈用户连读正误的视觉展示形式示意图,该实施例中,预定语句为“turnover”,通过界面上方左边的大圆圈指示用户是否进行了连读,该圆圈颜色变绿则表示进行了正确连读,该圆圈颜色变红则表示未进行正确连读。

此外,还可以通过文字和/或语音的方式对连读的正确发音方式进行提示。例如,在显示界面显示连读后的音标,或者显示连读时的发音技巧,或者可能存在的音变现象。

本实施例中通过显示界面将反馈信息反馈至用户,反馈信息可以包括但不限于:连读的正误、待连读部分的连读范围以及连读音素的发音特征。本实施例采用视觉元素辅助学习用户练习连读非连读的区分,在练习过程中加强对概念的理解,并能快速定位自己在练习时的问题所在。通过形象化的视觉元素形来辅助用户直观理解单词的连读情况。

下面对本发明实施例提供的连读识别校正装置进行介绍,下文描述的连读识别校正装置与上文描述的连读识别校正方法可相互对应参照。

图7为本发明实施例提供的连读识别校正装置的结构框图,参照图7连读识别校正装置可以包括:

获取模块100,用于获取针对预定语句录入的音频数据;

判断模块200,用于对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;

生成模块300,用于生成判断实际读音是否正确连读的反馈信息

作为一种具体实施方式,本申请实施例中所述判断模块200具体包括:

筛选单元,用于根据所述预定语句的单词发音以及预定的连读规则,筛选出可以连读的单词对;

添加单元,用于对筛选得到的单词对插入预定符号构建新的单词,并根据在连读时的发音方式构建对应的音素序列,将新构建的单词发音添加至发音词典中;

分析单元,用于对所述音频数据进行分析,根据单词的时间边界截取可以连读的单词对所对应的声学模型输出片段;

判断单元,用于将所述声学模型输出片段输入至预先构建的解码网络中,得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果。

作为一种具体实施方式,本申请实施例中所述判断模块200还用于:

在得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果之后,若判定所述预定语句中可以连读的单词对的实际读音为连读,则进一步判断连读单词是否满足预设要求;如果判定连读单词满足预设要求,则生成判断实际读音正确连读的反馈信息;如果判定连读单词不满足预设要求,则生成判断实际读音未正确连读的反馈信息。

作为一种具体实施方式,本申请实施例中所述预设要求包括:连读单词的发音分数大于预设第一阈值,和/或连读单词的音素时长小于预设第二阈值。

作为一种具体实施方式,本申请所提供的连读识别校正装置还可以进一步包括:

第一显示模块,用于在筛选出可以连读的单词对之后,通过显示界面对可以连读的单词对中待连读部分的音标以及字母用第一视觉元素进行标示,以提示连读范围以及连读音素的发音特征。

在上述任一实施例的基础上,本申请所提供的连读识别校正装置还可以进一步包括:

第二显示模块,用于在生成判断实际读音是否正确连读的反馈信息之后,通过显示界面的第二视觉元素标示出实际读音是否正确连读。

在上述任一实施例的基础上,本申请所提供的连读识别校正装置还可以进一步包括:

提示模块,用于生成判断实际读音是否正确连读的反馈信息之后,通过文字和/或语音的方式对连读的正确发音方式进行提示。

本实施例的连读识别校正装置用于实现前述的连读识别校正方法,因此连读识别校正装置中的具体实施方式可见前文中的连读识别校正方法的实施例部分,例如,获取模块100,判断模块200,生成模块300,分别用于实现上述连读识别校正方法中步骤s101,s102,s103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。

本申请所提供的装置可以自动对录入的音频数据进行分析,检测其中的连读是否正确,得到的反馈信息可以辅助用户理解连读的概念,从而帮助用户有效掌握英语口语中的连读技巧的效果。并且采用本申请不需要再由老师进行当面示范和纠正,因此可以不受学习时间和空间的限制,不仅节约了学习成本,还保证了有效学习的时间。

此外,本申请还提供了一种连读识别校正设备,应用于服务端1,如图8所示,所述设备包括:

存储器11,用于存储计算机程序;

处理器12,用于执行所述计算机程序时实现如下步骤:获取针对预定语句录入的音频数据;对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是连读识别校正设备的内部存储单元,例如硬盘。存储器11在另一些实施例中也可以是连读识别校正设备的外部存储设备,例如插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括连读识别校正设备的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于连读识别校正设备的应用软件及各类数据,例如连读识别校正程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行连读识别校正程序01等。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:根据所述预定语句的单词发音以及预定的连读规则,筛选出可以连读的单词对;对筛选得到的单词对插入预定符号构建新的单词,并根据在连读时的发音方式构建对应的音素序列,将新构建的单词发音添加至发音词典中;对所述音频数据进行分析,根据单词的时间边界截取可以连读的单词对所对应的声学模型输出片段;将所述声学模型输出片段输入至预先构建的解码网络中,得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

在得到判断所述预定语句中可以连读的单词对的实际读音是否正确连读的解码结果之后,若判定所述预定语句中可以连读的单词对的实际读音为连读,则进一步判断连读单词是否满足预设要求;如果判定连读单词满足预设要求,则生成判断实际读音正确连读的反馈信息;如果判定连读单词不满足预设要求,则生成判断实际读音未正确连读的反馈信息。

可以理解的是,本申请实施例中服务端可以包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算由大量计算机或网络服务器构成的云。

此外,本申请还提供了一种连读识别校正设备,应用于客户端2,如图9所示,所述设备包括:

音频采集装置21,用于录入针对预定语句的音频数据;

通信装置22,用于将所述音频数据发送至服务端,以便所述服务端对所述音频数据进行分析,判断所述预定语句中可以连续的单词对的实际读音是否正确连读;生成判断实际读音是否正确连读的反馈信息;并且接收所述服务端发送的反馈信息;

显示装置23,用于将所述反馈信息在显示界面上进行显示。

可选地,本申请实施例所提供的连读识别校正设备中显示装置23可以具体用于:在筛选出可以连读的单词对之后,通过显示界面对可以连读的单词对中待连读部分的音标以及字母用第一视觉元素进行标示,以提示连读范围以及连读音素的发音特征。

可选地,本申请实施例所提供的连读识别校正设备中显示装置23可以具体用于:在生成判断实际读音是否正确连读的反馈信息之后,通过显示界面的第二视觉元素标示出实际读音是否正确连读。

可选地,本申请实施例所提供的连读识别校正设备还可以进一步包括:提示装置,用于生成判断实际读音是否正确连读的反馈信息之后,通过文字和/或语音的方式对连读的正确发音方式进行提示。

可以理解的是,本申请实施例中客户端可以包括但不限于:智能手机、平板电脑、mp4、mp3、pc、pda、可穿戴设备和头戴显示设备等。

进一步地,本申请还提供了一种连读识别校正系统,如图10所示,该系统包括上述任一种服务端1以及上述任一种客户端2。用户可以通过客户端进行发音学习,客户端可以在显示界面上显示用户待学习的内容,并且还可以通过扬声器等音频播放装置向用户输出语音形式的音频内容,在用户进行语音的发音学习时,客户端可以通过音频采集装置采集用户发音时的音频数据,并将音频数据发送至服务端,由服务端进行连读识别校正的过程。在服务端对音频数据进行分析并得到反馈信息之后,将该反馈信息发送至客户端。通过客户端的显示装置对反馈信息进行显示,向用户提供视觉辅助信息。

此外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种连读识别校正方法的步骤。

本申请所提供的连读识别校正设备、连读识别校正系统、计算机可读存储介质与前述方法相对应。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

综上,本申请可以自动对录入的音频数据进行分析,检测其中的连读是否正确,得到的反馈信息可以辅助用户理解连读的概念,从而帮助用户有效掌握英语口语中的连读技巧的效果。并且采用本申请不需要再由老师进行当面示范和纠正,因此可以不受学习时间和空间的限制,不仅节约了学习成本,还保证了有效学习的时间。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的连读识别校正方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips