唱歌指导建议的提供方法、装置和服务器与流程

2021-01-28 16:01:46|

298|

起点商标网

本申请涉及计算机技术领域，尤其涉及一种唱歌指导建议的提供方法、装置和服务器。

背景技术：

相关技术中，在用户需要学习唱歌时，通常包含两种方式，一是线下找老师学，二是在线看视频学。线下找老师，费用高且上课时间不灵活，不方便；在线看教学视频，则所有用户看的视频都一样，无法针对不同用户的唱歌缺点提出针对性的提升方向。

技术实现要素：

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种唱歌指导建议的提供方法，结合用户唱歌的语音和嘴部图像，向用户提供有针对性的唱歌指导建议，方便了用户学习唱歌，提高了用户学习唱歌的效率。

本申请的第二个目的在于提出一种唱歌指导建议的提供装置。

本申请的第三个目的在于提出一种服务器。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

本申请的第五个目的在于提出一种计算机程序产品。

为达上述目的，本申请第一方面实施例提出了一种唱歌指导建议的提供方法，包括：获取用户的唱歌语音数据，并获取与所述唱歌语音数据同步的嘴部图像信息；确定所述唱歌语音数据在预设维度上的评分低于预设评分阈值；根据所述嘴部图像信息，确定所述用户在所述预设维度上的口型问题；根据所述口型问题向所述用户提供对应的指导建议。

本申请实施例的唱歌指导建议的提供方法，结合用户的唱歌语音数据和与唱歌语音数据同步的嘴部图像信息，在确定唱歌语音数据在预设维度上的评分低于预设评分阈值时，根据嘴部图像信息，确定用户在唱歌中的口型问题，并向用户提供与口型问题对应的指导建议。由此，结合用户唱歌的语音和嘴部图像，向用户提供有针对性的唱歌指导建议，方便了用户学习唱歌，提高了用户学习唱歌的效率。

为达上述目的，本申请第二方面实施例提出了一种唱歌指导建议的提供装置，包括：第一获取模块，用于获取用户的唱歌语音数据，并获取与所述唱歌语音数据同步的嘴部图像信息；第一确定模块，用于确定所述唱歌语音数据在预设维度上的评分低于预设评分阈值；第二确定模块，用于根据所述嘴部图像信息，确定所述用户在所述预设维度上的口型问题；指导模块，用于根据所述口型问题向所述用户提供对应的指导建议。

本申请实施例的唱歌指导建议的提供装置，结合用户的唱歌语音数据和与唱歌语音数据同步的嘴部图像信息，在确定唱歌语音数据在预设维度上的评分低于预设评分阈值时，根据嘴部图像信息，确定用户在唱歌中的口型问题，并向用户提供与口型问题对应的指导建议。由此，结合用户唱歌的语音和嘴部图像，向用户提供有针对性的唱歌指导建议，方便了用户学习唱歌，提高了用户学习唱歌的效率。

为达上述目的，本申请第三方面实施例提出了一种服务器，包括：处理器和存储器；其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如上述实施例描述的唱歌指导建议的提供方法。

为了实现上述目的，本申请第四方面实施例提出了一种非临时性计算机可读存储介质，该程序被处理器执行时实现如上述实施例描述的唱歌指导建议的提供方法。

为了实现上述目的，本申请第五方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，执行如上述实施例描述的唱歌指导建议的提供方法。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本申请一个实施例的唱歌指导建议的提供方法的流程图；

图2是步骤102的细化流程示意图；

图3是步骤103的细化流程示意图；

图4是根据本申请另一个实施例的唱歌指导建议的提供方法的流程图；

图5是根据本申请一个实施例的唱歌指导建议的提供装置的结构示意图；

图6是根据本申请另一个实施例的唱歌指导建议的提供装置的结构示意图；

图7是根据本申请另一个实施例的唱歌指导建议的提供装置的结构示意图；

图8是本申请一个实施例提供的执行唱歌指导建议的提供方法的服务器的硬件结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的基于唱歌指导建议的提供方法、装置及服务器。

图1是根据本申请一个实施例的唱歌指导建议的提供方法的流程图。

如图1所示，该唱歌指导建议的提供方法可以包括：

步骤101，获取用户的唱歌语音数据，并获取与唱歌语音数据同步的嘴部图像信息。

其中，需要说明的是，本申请实施例的唱歌指导建议的提供方法被配置在唱歌指导建议的提供装置中，该唱歌指导建议的提供装置可以设置在电子设备中，也可以设置服务器中。

其中，电子设备可以包括个人计算机、平板电话、手机等具有摄像头的设备，该实施例对此不作限定。

本申请实施例以唱歌指导建议的提供方法由服务器执行为例进行描述。

步骤102，确定唱歌语音数据在预设维度上的评分低于预设评分阈值。

其中，预设维度可以是服务器中默认设置的指导维度，也可以是用户根据需求自己设置的指导维度，以满足用户个性化设置预设维度的个性化需求。

其中，预设维度可以包括但不限于音准、音色、吐词、音域、音质等。

作为一种示例性的实施方式，在获取用户的唱歌语音数据之前，还可以向用户提供多个候选指导维度；获取用户从多个候选指导维度选择的目标指导维度，并将目标指导维度作为预设维度。

具体地，在接收到用户通过电子设备发送的唱歌指导请求后，服务器根据唱歌指导请求向电子设备反馈对应的候选指导维度。电子设备在对应的交互界面上向用户提供多个候选指导维度，电子设备获取用户从多个候选指导维度选择的目标指导维度，并将用户的维度选择结果发送给服务器。

对应地，服务器根据电子设备发送的维度选择结果，获取用户从多个候选指导维度选择的目标指导维度，并将目标指导维度作为预设维度。

其中，确定唱歌语音数据在预设维度上的评分低于预设评分阈值可通过多种方式实现，下面对唱歌语音数据在预设维度上的评分低于预设评分阈值的方式进行举例说明：

作为一种示例，可获取与预设维度对应的唱歌评分模型，并将所获取的用户的唱歌语音数据输出到语音评分模型，对应地，语音评分模型对唱歌语音数据进行分析，以确定出唱歌语音数据在预设维度上的评分，并输出唱歌语音数据在预设维度上的评分，然后，将该评分与该预设维度对应的预设评分阈值进行比较，以确定该评分是否超过预设评分阈值。

其中，预设评分阈值是在服务器中预先设置的在预设维度上的评分阈值。

作为另一种示例，可将唱歌语音数据输出到预设的唱歌评分模型，以通过该唱歌评分模型确定出唱歌语音数据在各个指导维度上的评分。然后，根据唱歌语音数据在各个指导维度上的评分，确定唱歌语音数据在预设维度上的评分。

例如，假设用户设置预设维度为音色，唱歌评分模型可以对音色、音准以及吐词三个指导维度进行评分。在将用户的唱歌语音数据输入到唱歌评分模型后。对应的，唱歌评分模型可对唱歌语音数据进行分析，并根据分析结果，输出评分结果，其中，评分结果中包括唱歌语音数据在音色、音准以及吐词上的评分。然后，根据评分结果，可以确定唱歌语音数据在音色上的评分。

作为另一种示例，如图2所示，确定唱歌语音数据在预设维度上的评分低于预设评分阈值，可以包括：

步骤1021，根据预设维度，提取唱歌语音数据的第一语音特征。

步骤1022，获取与预设维度对应的第二语音特征。

步骤1023，根据第一语音特征和第二语音特征的匹配度，确定唱歌语音数据在预设维度上的评分。

步骤1024，判断评分是否低于预设评分阈值。

步骤1025，如果评分低于预设评分阈值，则确定唱歌语音数据在预设维度上的评分低于预设评分阈值。

步骤103，根据嘴部图像信息，确定用户在预设维度上的口型问题。

其中，根据嘴部图像信息，确定用户在预设维度上的口型问题的实现方式有多种，下面进行示例性说明。

作为一种可能的实现方式，如图3所示，步骤103可以包括：

步骤1031，提取嘴部图像信息的第一口型特征信息。

步骤1032，获取与预设维度对应的第二口型特征信息。

步骤1033，对第一口型特征信息和第二口型特征信息进行比对分析，以得到特征差。

步骤1034，根据特征差，确定用户在预设维度上的口型问题。

作为另一种可能的实现方式，根据嘴部图像信息，确定用户在预设维度上的口型问题，可以包括：获取与预设维度对应的口型分析模型；通过口型分析模型对嘴部图像信息进行分析，并根据分析结果确定用户在所预设维度上的口型问题。

步骤104，根据口型问题向用户提供对应的指导建议。

其中，需要说明的是，对于不同口型问题，其向用户所提供的指导建议不同。

其中，指导建议可以包括但不限于与纠正该口型问题的教学视频、纠正该口型问题的练习技巧等。

作为一种可能的实现方式，在确定出用户的口型问题后，可根据预设的口型问题和指导建议的对应关系，确定出与口型问题对应的指导建议。

作为另一种可能的实现方式，可结合用户的口型问题，生成与用户口型问题对应的指导建议。

另外，为了进一步有针对性的对唱歌进行指导，还可以获取唱歌语音数据对应歌曲的教学视频，并将歌曲对应的教学视频提供给用户，以方便用户结合教学视频继续提高自身的唱歌水平。

本申请实施例提供另一种唱歌指导建议的提供方法，该方法是对图1所示的方法的进一步扩展和优化。

图4是根据本申请另一个实施例的唱歌指导建议的提供方法的流程图。

其中，需要说明的是，本申请实施例以唱歌指导建议的提供方法由服务器执行为例进行描述。

如图4所示，该唱歌指导建议的提供方法可以包括：

步骤401，接收电子设备发送的唱歌指导请求。

具体地，在使用电子设备的过程中，在用户有唱歌指导需求时，用户可通过电子设备向服务器发送唱歌指导请求。

与此同时，电子设备根据用户的唱歌指导请求，启动电子设备中的摄像头和语音采集设备。

步骤402，获取电子设备中摄像头所采集的图像。

步骤403，在确定所采集的图像中包括嘴部时，向用户发送提示信息，以使用户根据提示信息开始唱歌。

在本实施例中，对摄像头所采集到的图像进行监控，并在确定所采集到的图像包含嘴部时，提示用户开始唱歌，避免了摄像头所采集的图像中不包含嘴部，服务器无法根据用户的口型问题，向用户提供指导建议情况的发生。

步骤404，实时获取用户的唱歌语音数据，并获取与唱歌语音数据同步的嘴部图像信息。

在用户根据提示信息开始唱歌时，电子设备将采集到的唱歌语音信息和对应的嘴部图像信息实时发送给服务器，以使服务器可以根据唱歌语音数据和对应的嘴部图像信息进行实时分析。

步骤405，确定唱歌语音数据在预设维度上的评分低于预设评分阈值。

步骤406，根据嘴部图像信息，确定用户在预设维度上的口型问题。

其中，需要说明是，步骤405和步骤406，与前述实施例的步骤102和103相同，前述对步骤102和103的解释说明也适用于步骤405和步骤406，此处不再赘述。

步骤407，根据口型问题，获取对应的指导建议，并将指导信息发送给电子设备。

对应地，电子设备接收服务器返回的指导建议，并在电子设备的交互界面上为用户提供指导建议。

其中，需要说明的是，为了不对唱歌过程造成影响，作为一种示例性的实施方式，可以在接收到电子设备发送的录制唱歌语音数据结束指令后，向电子设备发送指导建议。

综上可以看出，该实施例结合唱歌语音数据和嘴部图像信息，确定用户在唱歌上的口型问题，并向用户提供有针对性的指导建议，方便了用户根据指导建议有针对性的改善自身唱歌上的问题，有利于用户提高自身的唱歌水平。

本申请实施例的唱歌指导建议的提供方法，在确定电子设备所采取到的图像中存在嘴部时，向用户发送开始唱歌的提示信息，然后，实时获取用户的唱歌数据，并获取与唱歌数据同步的嘴部图像信息，并在确定唱歌语音数据在预设维度上的评分低于预设评分阈值时，通过与唱歌语音数据同步的嘴部图像信息，确定用户的口型问题，并向用户反馈与口型问题对应的指导建议。由此，结合用户唱歌的语音和嘴部图像，向用户提供有针对性的唱歌指导建议，方便了用户学习唱歌，提高了用户学习唱歌的效率。

为了实现上述实施例，本申请还提出一种唱歌指导建议的提供装置。

图5是根据本申请一个实施例的唱歌指导建议的提供装置的结构示意图。

如图5所示，该唱歌指导建议的提供装置包括第一获取模块110、第一确定模块120、第二确定模块130和指导模块140，其中：

第一获取模块110，用于获取用户的唱歌语音数据，并获取与唱歌语音数据同步的嘴部图像信息。

第一确定模块120，用于确定唱歌语音数据在预设维度上的评分低于预设评分阈值。

第二确定模块130，用于根据嘴部图像信息，确定用户在预设维度上的口型问题。

指导模块140，用于根据口型问题向用户提供对应的指导建议。

其中，需要说明的是，前述对唱歌指导建议的提供方法实施例的解释说明也适用于该实施例的唱歌指导建议的提供装置，此处不再赘述。

在本申请的一个实施例中，第一确定模块120，具体用于：根据预设维度，提取唱歌语音数据的第一语音特征。获取与预设维度对应的第二语音特征。根据第一语音特征和第二语音特征的匹配度，确定唱歌语音数据在预设维度上的评分。判断评分是否低于预设评分阈值，其中，如果评分低于预设评分阈值，则确定唱歌语音数据在预设维度上的评分低于预设评分阈值。

在本申请的一个实施例中，第二确定模块130，具体用于：提取嘴部图像信息的第一口型特征信息。获取与预设维度对应的第二口型特征信息。对第一口型特征信息和第二口型特征信息进行比对分析，以得到特征差。根据特征差，确定用户在预设维度上的口型问题。

在本申请的另一个实施例中，第二确定模块130，具体用于：获取与预设维度对应的口型分析模型。通过口型分析模型对嘴部图像信息进行分析，并根据分析结果确定用户在所预设维度上的口型问题。

在本申请的一个实施例中，为了避免摄像头所采集到的图像信息中不包含嘴部，无法结合图像信息分析用户的口型问题，在图5所示的装置实施例的基础上，如图6所示，该装置还可以包括：

第二获取模块150，用于获取电子设备中摄像头所采集的图像。

提示模块160，用于在确定所采集的图像中包括嘴部时，向用户发送提示信息，以使用户根据提示信息开始唱歌。

在本申请的一个实施例中，为了满足用户个性化设置预设维度的个性化需求，在图5所示的装置实施例的基础上，如图7所示，该装置还可以包括：

提供模块180，用于向用户提供多个候选指导维度。

第三获取模块190，用于获取用户从多个候选指导维度选择的目标指导维度，并将目标指导维度作为预设维度。

其中，需要理解的是，前述图7所示的装置实施例中的提供模块180和第三获取模块190的结构也可以包含在前述图6所示的装置实施例中，对此本申请不进行限定。

为了实现上述实施例，本申请还提出一种非临时性计算机可读存储介质，当存储介质中的指令由处理器被执行时，使得能够执行上述实施例示出的唱歌指导建议的提供方法。

为了实现上述实施例，本申请还提出一种计算机程序产品，当计算机程序产品中的指令处理器执行时，执行上述实施例示出的唱歌指导建议的提供方法。

图8是本申请一个实施例提供的执行唱歌指导建议的提供方法的服务器的硬件结构示意图，如图8所示，该服务器包括：

存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。

处理器1002执行程序时实现上述实施例中提供的唱歌指导建议的提供方法。

进一步地，服务器还包括：

通信接口1003，用于存储器1001和处理器1002之间的通信。

存储器1001，用于存放可在处理器1002上运行的计算机程序。

存储器1001可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

处理器1002，用于执行程序时实现上述实施例的出行方式推荐方法。

如果存储器1001、处理器1002和通信接口1003独立实现，则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(industrystandardarchitecture，简称为isa)总线、外部设备互连(peripheralcomponent，简称为pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture，简称为eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器1001、处理器1002及通信接口1003，集成在一块芯片上实现，则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。

处理器1002可能是一个中央处理器(centralprocessingunit，简称为cpu)，或者是特定集成电路(applicationspecificintegratedcircuit，简称为asic)，或者是被配置成实施本发明实施例的一个或多个集成电路。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或装置描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或装置可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例装置携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括装置实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。