HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基于深度学习的英语发音质量评估方法和系统与流程

2021-01-28 14:01:05|235|起点商标网
基于深度学习的英语发音质量评估方法和系统与流程

本发明涉及智能教育的技术领域,特别涉及基于深度学习的英语发音质量评估方法和系统。



背景技术:

在英语教学中,英语发音准确与否会直接影响学生的英语学习效率,而现有的英语发音训练通常都是通过跟读方式来实现的,这种跟读方式只能保证学生通过机械化重读来自行发现并纠正英语发音的缺陷,其并不能对学生在实际英语发音过程中的每一个英语发音进行客观的、准确的和快速的发音质量评估,这无法有效地改善学生的英语发音质量和降低学生学习英语的体验性。



技术实现要素:

针对现有技术存在的缺陷,本发明提供基于深度学习的英语发音质量评估方法和系统,其通过获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像,再将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值,最后根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量评估分值;可见,该基于深度学习的英语发音质量评估方法和系统通过对预设对象的英语语音发音和英语发音口型这两个不同方面对其英语发音质量进行综合评估,这样能够全面地和精准地评估预设对象的实际英语发音准确性和标准程度,并相应给出客观和可靠的发音质量评估分值,从而有效地提高学生的英语发音质量和改善学生学习英语的体验性。

本发明提供基于深度学习的英语发音质量评估方法,其特征在于,其包括如下步骤:

步骤s1,获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对所述初始英语语音数据和所述初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像;

步骤s2,将所述待评估英语语音数据转换为待评估英文文本数据,并将所述待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将所述待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值;

步骤s3,根据所述语音质量评价值和/或所述英语发音口型匹配度评价值,确定所述预设对象在当前英语发音过程中的最终英语发音质量;

进一步,在所述步骤s1中,获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对所述初始英语语音数据和所述初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像具体包括,

步骤s101,在所述英语发音过程中,对所述预设对象进行多方位录音和拍摄,从而获得所述初始英语语音数据和每一个英语发音对应的所述初始口型影像;

步骤s102,识别所述初始英语语音数据中的背景噪声成分,并针对所述背景噪声成分进行滤波降噪处理,从而获得所述待评估英语语音数据;

步骤s103,对所述初始口型影像进行像素锐化处理,从而得到所述待评估口型影像;

进一步,在所述步骤s2中,将所述待评估英语语音数据转换为待评估英文文本数据,并将所述待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将所述待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值具体包括,

步骤s201,对所述待评估英语语音数据进行语音识别处理,以此获得所述待评估英文文本数据,并将所述待评估英文文本数据拆分为n个英文关键词,以及将所述预设标准英文文本数据拆分为m个英文关键词;

步骤s202,根据下面公式(1)和(2),将所述n个英文关键词与所述预设标准英文文本数据进行比对,从而获得所述语音质量评价值

在上述公式(1)和(2)中,β1表示所述语音质量评价值,fi表示所述待评估英文文本数据中第i个英文关键词包含的字数、且i=1、2、3、…、n,n表示所述待评估英文文本数据包含的英文关键词的总数量,fave表示f1、f2、f3、…、fn的平均值,l1表示所述待评估英文文本数据的文本长度,l2表示所述预设标准英文文本数据的文本长度,m表示所述预设标准英文文本数据包含的英文关键词的总数量,fj表示所述预设标准英文文本数据中第j个英文关键词包含的字数、且j=1、2、3、…、m;

步骤s203,根据下面公式(3),确定所述待评估口型影像的第x帧图像与所述预设标准英语发音口型影像的第x帧图像之间的英语发音口型匹配度评价值yx

在上述公式(3)中,k表示所述待评估口型影像的第x帧图像和所述预设标准英语发音口型影像的第x帧图像各自的图像像素行数,p表示所述待评估口型影像的第x帧图像和所述预设标准英语发音口型影像的第x帧图像各自的图像像素列数,r(k,p)表示所述预设标准英语发音口型影像的第x帧图像第k行第p列的图像像素灰度值,q(k,p)表示所述待评估口型影像的第x帧图像第k行第p列的图像像素灰度值;

进一步,在所述步骤s3中,根据所述语音质量评价值和/或所述英语发音口型匹配度评价值,确定所述预设对象在当前英语发音过程中的最终英语发音质量具体包括,

步骤s301,将所述语音质量评价值β1与预设语音质量评价阈值进行比对,若所述语音质量评价值β1大于或者等于所述预设语音质量评价阈值,则将所述语音质量评价值β1作为所述预设对象在当前英语发音过程中的最终英语发音质量评估分值;

步骤s302,若所述语音质量评价值β1小于所述预设语音质量评价阈值,则从所有英语发音口型匹配度评价值yx中筛选得到最大的英语发音口型匹配度评价值ymax,并将所述预设对象的每一个英语发音对应的英语发音口型匹配度评价值ymax进行累加处理,从而所述累加处理得到的累加结果作为所述预设对象在当前英语发音过程中的最终英语发音质量评估分值。

本发明还提供基于深度学习的英语发音质量评估系统,其特征在于,其包括英语语音数据获取模块、口型影像获取模块、预处理模块、语音质量评价值确定模块、英语发音口型匹配度评价值确定模块和英语发音质量评估分值确定模块;其中,

所述英语语音数据获取模块用于获取预设对象在进行英语发音过程中对应的初始英语语音数据;

所述用于口型影像获取模块用于获取预设对象在进行英语发音过程中每一个英语发音对应的初始口型影像;

所述预处理模块用于分别对所述初始英语语音数据和所述初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像;

所述语音质量评价值确定模块用于将所述待评估英语语音数据转换为待评估英文文本数据,并将所述待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值;

所述英语发音口型匹配度评价值确定模块用于将所述待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值;

所述英语发音质量评估分值确定模块用于根据所述语音质量评价值和/或所述英语发音口型匹配度评价值,确定所述预设对象在当前英语发音过程中的最终英语发音质量;

进一步,所述英语语音数据获取模块获取预设对象在进行英语发音过程中对应的初始英语语音数据具体包括在所述英语发音过程中,对所述预设对象进行多方位录音,从而获得所述初始英语语音数据;

所述用于口型影像获取模块获取预设对象在进行英语发音过程中每一个英语发音对应的初始口型影像具体包括在所述英语发音过程中,对所述预设对象进行拍摄,从而获得每一个英语发音对应的所述初始口型影像;

所述预处理模块分别对所述初始英语语音数据和所述初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像具体包括识别所述初始英语语音数据中的背景噪声成分,并针对所述背景噪声成分进行滤波降噪处理,从而获得所述待评估英语语音数据,以及对所述初始口型影像进行像素锐化处理,从而得到所述待评估口型影像;

进一步,所述语音质量评价值确定模块将所述待评估英语语音数据转换为待评估英文文本数据,并将所述待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值具体包括,

对所述待评估英语语音数据进行语音识别处理,以此获得所述待评估英文文本数据,并将所述待评估英文文本数据拆分为n个英文关键词,以及将所述预设标准英文文本数据拆分为m个英文关键词,

再根据下面公式(1)和(2),将所述n个英文关键词与所述预设标准英文文本数据进行比对,从而获得所述语音质量评价值

在上述公式(1)和(2)中,β1表示所述语音质量评价值,fi表示所述待评估英文文本数据中第i个英文关键词包含的字数、且i=1、2、3、…、n,n表示所述待评估英文文本数据包含的英文关键词的总数量,fave表示f1、f2、f3、…、fn的平均值,l1表示所述待评估英文文本数据的文本长度,l2表示所述预设标准英文文本数据的文本长度,m表示所述预设标准英文文本数据包含的英文关键词的总数量,fj表示所述预设标准英文文本数据中第j个英文关键词包含的字数、且j=1、2、3、…、m;

以及,

所述英语发音口型匹配度评价值确定模块将所述待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值具体包括,

根据下面公式(3),确定所述待评估口型影像的第x帧图像与所述预设标准英语发音口型影像的第x帧图像之间的英语发音口型匹配度评价值yx

在上述公式(3)中,k表示所述待评估口型影像的第x帧图像和所述预设标准英语发音口型影像的第x帧图像各自的图像像素行数,p表示所述待评估口型影像的第x帧图像和所述预设标准英语发音口型影像的第x帧图像各自的图像像素列数,r(k,p)表示所述预设标准英语发音口型影像的第x帧图像第k行第p列的图像像素灰度值,q(k,p)表示所述待评估口型影像的第x帧图像第k行第p列的图像像素灰度值;

进一步,所述英语发音质量评估分值确定模块根据所述语音质量评价值和/或所述英语发音口型匹配度评价值,确定所述预设对象在当前英语发音过程中的最终英语发音质量具体包括,

将所述语音质量评价值β1与预设语音质量评价阈值进行比对,若所述语音质量评价值β1大于或者等于所述预设语音质量评价阈值,则将所述语音质量评价值β1作为所述预设对象在当前英语发音过程中的最终英语发音质量评估分值,

若所述语音质量评价值β1小于所述预设语音质量评价阈值,则从所有英语发音口型匹配度评价值yx中筛选得到最大的英语发音口型匹配度评价值ymax,并将所述预设对象的每一个英语发音对应的英语发音口型匹配度评价值ymax进行累加处理,从而所述累加处理得到的累加结果作为所述预设对象在当前英语发音过程中的最终英语发音质量评估分值。

相比于现有技术,该基于深度学习的英语发音质量评估方法和系统通过获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像,再将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值,最后根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量评估分值;可见,该基于深度学习的英语发音质量评估方法和系统通过对预设对象的英语语音发音和英语发音口型这两个不同方面对其英语发音质量进行综合评估,这样能够全面地和精准地评估预设对象的实际英语发音准确性和标准程度,并相应给出客观和可靠的发音质量评估分值,从而有效地提高学生的英语发音质量和改善学生学习英语的体验性。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的基于深度学习的英语发音质量评估方法的流程示意图。

图2为本发明提供的基于深度学习的英语发音质量评估系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参阅图1,为本发明实施例提供的基于深度学习的英语发音质量评估方法的流程示意图。该基于深度学习的英语发音质量评估方法包括如下步骤:

步骤s1,获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像;

步骤s2,将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值;

步骤s3,根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量。

优选地,在该步骤s1中,获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像具体包括,

步骤s101,在该英语发音过程中,对该预设对象进行多方位录音和双目拍摄,从而获得该初始英语语音数据和每一个英语发音对应的该初始口型影像;

步骤s102,识别该初始英语语音数据中的背景噪声成分,并针对该背景噪声成分进行滤波降噪处理,从而获得该待评估英语语音数据;

步骤s103,对该初始口型影像进行像素锐化处理,从而得到该待评估口型影像。

优选地,在该步骤s2中,将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值具体包括,

步骤s201,对该待评估英语语音数据进行语音识别处理,以此获得该待评估英文文本数据,并将该待评估英文文本数据拆分为n个英文关键词,以及将该预设标准英文文本数据拆分为m个英文关键词;

步骤s202,根据下面公式(1)和(2),将该n个英文关键词与该预设标准英文文本数据进行比对,从而获得该语音质量评价值

在上述公式(1)和(2)中,β1表示该语音质量评价值,fi表示该待评估英文文本数据中第i个英文关键词包含的字数、且i=1、2、3、…、n,n表示该待评估英文文本数据包含的英文关键词的总数量,fave表示f1、f2、f3、…、fn的平均值,l1表示该待评估英文文本数据的文本长度,l2表示该预设标准英文文本数据的文本长度,m表示该预设标准英文文本数据包含的英文关键词的总数量,fj表示该预设标准英文文本数据中第j个英文关键词包含的字数、且j=1、2、3、…、m;

步骤s203,根据下面公式(3),确定该待评估口型影像的第x帧图像与该预设标准英语发音口型影像的第x帧图像之间的英语发音口型匹配度评价值yx

在上述公式(3)中,k表示该待评估口型影像的第x帧图像和该预设标准英语发音口型影像的第x帧图像各自的图像像素行数,p表示该待评估口型影像的第x帧图像和该预设标准英语发音口型影像的第x帧图像各自的图像像素列数,r(k,p)表示该预设标准英语发音口型影像的第x帧图像第k行第p列的图像像素灰度值,q(k,p)表示该待评估口型影像的第x帧图像第k行第p列的图像像素灰度值。

优选地,在该步骤s3中,根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量评估分值具体包括,

步骤s301,将该语音质量评价值β1与预设语音质量评价阈值进行比对,若该语音质量评价值β1大于或者等于该预设语音质量评价阈值,则将该语音质量评价值β1作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值;

步骤s302,若该语音质量评价值β1小于该预设语音质量评价阈值,则从所有英语发音口型匹配度评价值yx中筛选得到最大的英语发音口型匹配度评价值ymax,并将该预设对象的每一个英语发音对应的英语发音口型匹配度评价值ymax进行累加处理,从而该累加处理得到的累加结果作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值。

总体而言,通过获取英语发音时的初始英语语音数据和每一个英语发音对应的初始口型影像,先通过公式(1)和公式(2)计算由初始英语语音数据转换成的待评估英文文本的语音质量评价值,若语音质量评价值大于或者等于预设语音质量评价阈值,说明获取的初始英语语音数据清晰、准确,可将语音质量评价值作为最终英语发音质量评估分值,若语音质量评价值小于预设语音质量评价阈值,说明获取的初始英语语音数据不完整,此时,通过初始口型影像对英语发音质量进行评估,在获取英语发音的同时,获取每一个英语发音对应的初始口型影像,然后将初始口型影像的每一帧图像与预设标准英语发音口型影像的每一帧图像进行匹配,并获取初始口型影像的每一帧图像与预设标准英语发音口型影像的每一帧图像匹配度最大值,最后将初始口型影像所有帧图像对应的匹配度最大值累加获得最终值,并将累加结果作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值,在英语发音时通过获取初始英语语音数据和初始口型影像,先通过初始英语语音数据评估分数,当获取初始英语语音数据不完整时,再通过初始口型影像评估分数,避免因初始英语语音数据不完整而造成评估分数的错误,可以使得评估方法更加准确,最终评估分数更加真实可信。

参阅图2,为本发明实施例提供的基于深度学习的英语发音质量评估系统的结构示意图。该基于深度学习的英语发音质量评估系统包括英语语音数据获取模块、口型影像获取模块、预处理模块、语音质量评价值确定模块、英语发音口型匹配度评价值确定模块和英语发音质量评估分值确定模块;其中,

该英语语音数据获取模块用于获取预设对象在进行英语发音过程中对应的初始英语语音数据;

该用于口型影像获取模块用于获取预设对象在进行英语发音过程中每一个英语发音对应的初始口型影像;

该预处理模块用于分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像;

该语音质量评价值确定模块用于将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值;

该英语发音口型匹配度评价值确定模块用于将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值;

该英语发音质量评估分值确定模块用于根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量评估分值。

优选地,该英语语音数据获取模块获取预设对象在进行英语发音过程中对应的初始英语语音数据具体包括在该英语发音过程中,对该预设对象进行多方位录音,从而获得该初始英语语音数据;

该用于口型影像获取模块获取预设对象在进行英语发音过程中每一个英语发音对应的初始口型影像具体包括在该英语发音过程中,对该预设对象进行双目拍摄,从而获得每一个英语发音对应的该初始口型影像;

该预处理模块分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像具体包括识别该初始英语语音数据中的背景噪声成分,并针对该背景噪声成分进行滤波降噪处理,从而获得该待评估英语语音数据,以及对该初始口型影像进行像素锐化处理,从而得到该待评估口型影像。

优选地,该语音质量评价值确定模块将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值具体包括,

对该待评估英语语音数据进行语音识别处理,以此获得该待评估英文文本数据,并将该待评估英文文本数据拆分为n个英文关键词,以及将该预设标准英文文本数据拆分为m个英文关键词,

再根据下面公式(1)和(2),将该n个英文关键词与该预设标准英文文本数据进行比对,从而获得该语音质量评价值

在上述公式(1)和(2)中,β1表示该语音质量评价值,fi表示该待评估英文文本数据中第i个英文关键词包含的字数、且i=1、2、3、…、n,n表示该待评估英文文本数据包含的英文关键词的总数量,fave表示f1、f2、f3、…、fn的平均值,l1表示该待评估英文文本数据的文本长度,l2表示该预设标准英文文本数据的文本长度,m表示该预设标准英文文本数据包含的英文关键词的总数量,fj表示该预设标准英文文本数据中第j个英文关键词包含的字数、且j=1、2、3、…、m;

以及,

该英语发音口型匹配度评价值确定模块将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值具体包括,

根据下面公式(3),确定该待评估口型影像的第x帧图像与该预设标准英语发音口型影像的第x帧图像之间的英语发音口型匹配度评价值yx

在上述公式(3)中,k表示该待评估口型影像的第x帧图像和该预设标准英语发音口型影像的第x帧图像各自的图像像素行数,p表示该待评估口型影像的第x帧图像和该预设标准英语发音口型影像的第x帧图像各自的图像像素列数,r(k,p)表示该预设标准英语发音口型影像的第x帧图像第k行第p列的图像像素灰度值,q(k,p)表示该待评估口型影像的第x帧图像第k行第p列的图像像素灰度值。

优选地,该英语发音质量评估分值确定模块根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量具体包括,

将该语音质量评价值β1与预设语音质量评价阈值进行比对,若该语音质量评价值β1大于或者等于该预设语音质量评价阈值,则将该语音质量评价值β1作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值,

若该语音质量评价值β1小于该预设语音质量评价阈值,则从所有英语发音口型匹配度评价值yx中筛选得到最大的英语发音口型匹配度评价值ymax,并将该预设对象的每一个英语发音对应的英语发音口型匹配度评价值ymax进行累加处理,从而该累加处理得到的累加结果作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值。

总体而言,通过获取英语发音时的初始英语语音数据和每一个英语发音对应的初始口型影像,先通过公式(1)和公式(2)计算由初始英语语音数据转换成的待评估英文文本的语音质量评价值,若语音质量评价值大于或者等于预设语音质量评价阈值,说明获取的初始英语语音数据清晰、准确,可将语音质量评价值作为最终英语发音质量评估分值,若语音质量评价值小于预设语音质量评价阈值,说明获取的初始英语语音数据不完整,此时,通过初始口型影像对英语发音质量进行评估,在获取英语发音的同时,获取每一个英语发音对应的初始口型影像,然后将初始口型影像的每一帧图像与预设标准英语发音口型影像的每一帧图像进行匹配,并获取初始口型影像的每一帧图像与预设标准英语发音口型影像的每一帧图像匹配度最大值,最后将初始口型影像所有帧图像对应的匹配度最大值累加获得最终值,并将累加结果作为该预设对象在当前英语发音过程中的最终英语发音质量评估分值,在英语发音时通过获取初始英语语音数据和初始口型影像,先通过初始英语语音数据评估分数,当获取初始英语语音数据不完整时,再通过初始口型影像评估分数,避免因初始英语语音数据不完整而造成评估分数的错误,可以使得评估方法更加准确,最终评估分数更加真实可信。

从上述实施例的内容可知,该基于深度学习的英语发音质量评估方法和系统通过获取预设对象在进行英语发音过程中对应的初始英语语音数据和每一个英语发音对应的初始口型影像,并分别对该初始英语语音数据和该初始口型影像进行预处理,以此获得待评估英语语音数据和待评估口型影像,再将该待评估英语语音数据转换为待评估英文文本数据,并将该待评估英文文本数据与预设标准英文文本数据进行比对,以此获得语音质量评价值,以及将该待评估口型影像与预设标准英语发音口型影像进行比对,以此获得英语发音口型匹配度评价值,最后根据该语音质量评价值和/或该英语发音口型匹配度评价值,确定该预设对象在当前英语发音过程中的最终英语发音质量评估分值;可见,该基于深度学习的英语发音质量评估方法和系统通过对预设对象的英语语音发音和英语发音口型这两个不同方面对其英语发音质量进行综合评估,这样能够全面地和精准地评估预设对象的实际英语发音准确性和标准程度,并相应给出客观和可靠的发音质量评估分值,从而有效地提高学生的英语发音质量和改善学生学习英语的体验性。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 英语发音方法
tips