一种相册播放方法及装置与流程

2021-01-28 17:01:54|

327|

起点商标网

本发明涉及通信领域，具体而言，涉及一种相册播放方法及装置。

背景技术：

目前市场上相册的播放方式大多数还是传统的触摸选择方式，人必须与设备接触，通过手指触控选择需要的功能，这种方式在人与设备距离较远时极为不方便。

针对相关技术中通过手指触控播放相册，对于用户与设备距离较远时由于无法触控导致不能播放相册的问题，尚未提出解决方案。

技术实现要素：

本发明实施例提供了一种相册播放方法及装置，以至少解决相关技术中通过手指触控播放相册，对于用户与设备距离较远时由于无法触控导致不能播放相册的问题。

根据本发明的一个实施例，提供了一种相册播放方法，包括：

采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

接收第二语音信息，并提取所述第二语音信息对应的操作指令；

根据所述操作指令播放所述相册。

可选地，根据所述操作指令播放所述相册包括：

根据预先存储的声纹特征与用户标识的对应关系确定所述目标声纹特征对应的目标用户标识；

根据预先为所述目标用户标识设置的播放方式播放所述相册，其中，所述播放方式至少包括以下之一：播放目标、播放顺序、播放速度，其中，所述播放目标与图片类别对应。

可选地，在根据预先为所述目标用户标识设置的播放方式播放所述相册之后，所述方法还包括：

接收第三语音信息；

识别所述第三语音信息对应的调整所述播放方式的调整指令；

根据所述调整指令调整所述播放方式；

根据调整后的播放方式播放所述相册。

可选地，在采集用于唤醒相册的第一语音信息之前，所述方法还包括：

采集用于触发相册的一个或多个语音开锁指令；

提取所述一个或多个语音开锁指令的声纹特征；

将一个或多个声纹特征设置为所述相册的声纹锁，并存储所述一个或多个声纹特征。

可选地，在提取所述一个或多个语音开锁指令的声纹特征之后，所述方法还包括：

通过显示界面提示设置每个声纹特征的用户标识；

根据在所述显示界面的交互操作确定每个声纹特征对应的用户标识；

存储所述声纹特征与用户标识的对应关系。

可选地，所述方法还包括：

提取所述相册中的图片信息，其中，所述图片信息包括以下至少之一：拍摄时间、拍摄地点、图片标签、相册名称；

根据所述图片信息对所述相册中的图片进行分类，得到多个图片类别；

根据所述多个图片类别分别为所述用户标识设置播放方式。

可选地，在根据所述操作指令播放所述相册之后，所述方法还包括：

接收第四语音信息；

识别所述第四语音信息对应的关闭所述相册的关闭指令；

根据所述关闭指令关闭所述相册。

根据本发明的另一个实施例，还提供了一种相册播放装置，包括：

第一采集模块，用于采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

唤醒模块，用于在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

第一提取模块，用于接收第二语音信息，并提取所述第二语音信息对应的操作指令；

第一播放模块，用于根据所述操作指令播放所述相册。

可选地，所述第一播放模块包括：

确定子模块，用于根据预先存储的声纹特征与用户标识的对应关系确定所述目标声纹特征对应的目标用户标识；

播放子模块，用于根据预先为所述目标用户标识设置的播放方式播放所述相册，其中，所述播放方式至少包括以下之一：播放目标、播放顺序、播放速度，其中，所述播放目标与图片类别对应。

可选地，所述装置还包括：

第一接收模块，用于接收第三语音信息；

第一识别模块，用于识别所述第三语音信息对应的调整所述播放方式的调整指令；

调整模块，用于根据所述调整指令调整所述播放方式；

第二播放模块，用于根据调整后的播放方式播放所述相册。

可选地，所述装置还包括：

第二采集模块，用于采集用于触发相册的一个或多个语音开锁指令；

第二提取模块，用于提取所述一个或多个语音开锁指令的声纹特征；

第一存储模块，用于将一个或多个声纹特征设置为所述相册的声纹锁，并存储所述一个或多个声纹特征。

可选地，所述装置还包括：

第一设置模块，用于通过显示界面提示设置每个声纹特征的用户标识；

确定模块，用于根据在所述显示界面的交互操作确定每个声纹特征对应的用户标识；

第二存储模块，用于存储所述声纹特征与用户标识的对应关系。

可选地，所述装置还包括：

第三提取模块，用于提取所述相册中的图片信息，其中，所述图片信息包括以下至少之一：拍摄时间、拍摄地点、图片标签、相册名称；

分类模块，用于根据所述图片信息对所述相册中的图片进行分类，得到多个图片类别；

第二设置模块，用于根据所述多个图片类别分别为所述用户标识设置播放方式。

可选地，所述装置还包括：

第二接收模块，用于接收第四语音信息；

第二识别模块，用于识别所述第四语音信息对应的关闭所述相册的关闭指令；

关闭模块，用于根据所述关闭指令关闭所述相册。

根据本发明的又一个实施例，还提供了一种计算机可读的存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；接收第二语音信息，并提取所述第二语音信息对应的操作指令；根据所述操作指令播放所述相册，可以解决相关技术中通过手指触控播放相册，对于用户与设备距离较远时由于无法触控导致不能播放相册的问题，通过语音控制相册播放，提高了用户体验。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的相册播放方法的移动终端的硬件结构框图；

图2是根据本发明实施例的相册播放方法的流程图；

图3是根据本发明实施例的声控智能相册播放的流程图；

图4是根据本发明实施例的相册播放装置的框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的相册播放方法的移动终端的硬件结构框图，如图1所示，移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104，可选地，上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的相册播放方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(networkinterfacecontroller，简称为nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(radiofrequency，简称为rf)模块，其用于通过无线方式与互联网进行通讯。

基于上述的移动终端或网络架构，在本实施例中提供了一种相册播放方法，图2是根据本发明实施例的相册播放方法的流程图，如图2所示，该流程包括如下步骤：

步骤s202，采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

本发明实施例中，通过上述第一语言信息唤醒相册，即声纹锁，声纹锁建立在声纹识别技术的基础之上，是声纹识别技术的一个具体的应用。语音生物特征识别，又称说话人识别，俗称声纹识别，是根据说话人的发音生理和行为特征，自动识别说话人身份的一种生物识别方法。声纹识别所提供的安全性可与其他生物识别技术(如：指纹、掌形和虹膜)一样，安全性较高。声音信号便于远程传输和获取，在基于电信和网络的身份识别应用中，声纹识别更为擅长，得天独厚。

所谓声纹(voiceprint)，是用电声学仪器显示的携带言语信息的声波频谱，任何两个人的声纹图谱都有差异。声纹识别(voiceprintrecognition,vpr)，也称为说话人识别(speakerrecognition)，有两类，即说话人辨认(speakeridentification)和说话人确认(speakerverification)。前者用以判断某段语音是若干人中的哪一个所说的，是“多选一”问题；而后者用以确认某段语音是否是指定的某个人所说的，是“一对一判别”问题。不管是辨认还是确认，都需要先对说话人的声纹进行建模，这就是所谓的“训练”或“学习”过程。

声纹识别的主要任务包括：语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。

步骤s204，在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

步骤s206，接收第二语音信息，并提取所述第二语音信息对应的操作指令；

本发明实施例中的语音识别指的是让机器通过识别和理解过程，把语音信号转变为相应的文本或命令的技术。语音识别的技术原理是模式识别，其过程可以总结为：预处理-特征提取-基于语音模型库下的模式匹配-基于语言模型库下的语言处理-完成识别。

步骤s208，根据所述操作指令播放所述相册。

进一步的，上述步骤s208具体可以包括：根据预先存储的声纹特征与用户标识的对应关系确定所述目标声纹特征对应的目标用户标识；根据预先为所述目标用户标识设置的播放方式播放所述相册，其中，所述播放方式至少包括以下之一：播放目标、播放顺序、播放速度，其中，所述播放目标与图片类别对应。

通过上述步骤s202至s208，采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；接收第二语音信息，并提取所述第二语音信息对应的操作指令；根据所述操作指令播放所述相册，可以解决相关技术中通过手指触控播放相册，对于用户与设备距离较远时由于无法触控导致不能播放相册的问题，通过语音控制相册播放，提高了用户体验。

用户要用语音打开相册，通过用户说出‘打开相册’，解锁相册。相册解锁后，用户可以对设备说出‘播放下一张’、‘播放上一张’、‘播放快一点’、‘播放慢一点’等指令操控设备的播放方式；用户还可以说出‘播放人物’、‘播放2月19日的照片’、‘播放收藏照片’等指令操控设备的播放内容。除此之外，设备还会根据每位用户的播放习惯，默认智能的播放用户喜欢的照片。最后，相册播放完毕后，用户可以说出‘关闭相册’，让设备处于待机状态，等待下一次被唤起。

本发明实施例中，用户还可以调整播放方式，在根据预先为所述目标用户标识设置的播放方式播放所述相册之后，接收第三语音信息；识别所述第三语音信息对应的调整所述播放方式的调整指令；根据所述调整指令调整所述播放方式；根据调整后的播放方式播放所述相册。

本发明实施例中，在采集用于唤醒相册的第一语音信息之前，采集用于触发相册的一个或多个语音开锁指令；提取所述一个或多个语音开锁指令的声纹特征；将一个或多个声纹特征设置为所述相册的声纹锁，并存储所述一个或多个声纹特征，以便后续用户在唤醒相册时，可以比对是否为之前存储的声纹特征，只有匹配成功，才可以唤醒相册，之后才能够控制相册的播放。即先录入声纹锁，设备以用户的声音为开锁密码，可以为家庭每个成员录入语音开锁指令‘打开相册’，获取用户声音特征，作为声纹锁，并且可以为其设置身份，比如爸爸、儿子等。

在一可选的实施例中，在提取所述一个或多个语音开锁指令的声纹特征之后，通过显示界面提示设置所述一个或多个声纹特征中每个声纹特征的用户标识，即用户自己设置对应的标识，例如，爸爸，妈妈，宝宝等；根据在所述显示界面的交互操作确定每个声纹特征对应的用户标识；存储所述声纹特征与用户标识的对应关系。

在另一可选的实施例中，可以对相册分类，为不同用户设置对应的播放方式，具体的，提取所述相册中的图片信息，其中，所述图片信息包括以下至少之一：拍摄时间、拍摄地点、图片标签、相册名称，图片标签可以是人为设置的，也可以是通过图像识别技术识别出图片内容之后自动打的标签，标签具体可以是人物、风景等；根据所述图片信息对所述相册中的图片进行分类，得到多个图片类别，例如，包括第一类别图片为第一地点拍摄的，第二类别图片为第二地点拍摄的，第三类别图片为人物，第四类别图片为风景，第五类别为2018年等等，也可以直接是用户事先创建的相册名称，同一张图片可以只属于一个类别，也可以同时属于多个类别；根据所述多个图片类别分别为所述用户标识设置播放方式，可以为不同的用户标识设置不同的播放方式。即设备会对图片进行分类，按类别智能化的播放图片。从图片拍摄信息中提取拍摄时间，地点，这样图片就可以按日期和地点播放；还可以识别出人物和风景，按图片类型进行分类播放；也可以为相册自定义名称，按照相册名字进行播放等。

本发明实施例中，还可以通过语音控制关闭播放完成的相册或者正在播放过程中的相册，具体的，在根据所述操作指令播放所述相册之后，接收第四语音信息；识别所述第四语音信息对应的关闭所述相册的关闭指令；根据所述关闭指令关闭所述相册。

图3是根据本发明实施例的声控智能相册播放的流程图，如图3所示，包括:

步骤s301，录入一个或多个用户的语音开锁指令，提取其声纹特征，得到声纹锁，只有用户说出‘打开相册’才能够唤起设备播放相册的功能，其他人即使说出‘打开相册’，也不能唤醒设备。

步骤s302，建立用户信息，录入用户信息，如用户的名字，性别，年龄，身份和角色等信息。

步骤s303，语音唤醒相册，用户说出‘打开相册’，唤醒设备；

步骤s304，判断在预定时间内是否接收到触发播放的语音指令，在判断结果为是的情况下，执行步骤s305，否则进入待机；

步骤s305，根据用户的播放指令为用户播放用户可能喜欢的图片，此时，设备可以根据用户声音识别出是哪位用户，并会记录该用户每次的播放喜好。相册被唤醒后，会进行默认播放，默认播放的内容由该用户以往的播放记录智能化推荐。

步骤s306，判断是否接收到调整播放方式的调整语音指令，在判断结果为是的情况下，执行步骤s307，否则执行步骤s309；

步骤s307，根据调整语音指令调整播放方式，即若用户发出语音指令，则会按照用户的语音指令进行播放，当用户不喜欢默认播放的内容，可以通过语音指令控制相册的播放内容，如：可以说‘播放日本旅游时拍的照片’、‘播放我的收藏’、‘播放上一张’、‘暂停播放’等。；

步骤s308，继续按照默认的播放方式播放，即若用户没有任何语音指令，相册将会一直播放默认的播放内容；

步骤s309，设备进入待机，具体的，可以是用户观看完相册后，直接进行待机，也可以是接收到用户的‘关闭相册’指令之后设备进行待机，等待下一次被唤醒。

本发明实施例，通过语音识别技术，让用户发出指令，播放相册，不仅可以远距离操控相册播放，还可以给相册加密，起到保护隐私的作用。当用户和相册播放设备有一定距离时，人不需要起身走近设备，通过手指触控的方式操控相册，从而提高用户的使用体验，方便快捷。操控相册的播放方式，从手指触控变为声音控制，简单方便，可以一边干其他的事情，一边对相册操控，提高效率。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种相册播放装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本发明实施例的相册播放装置的框图，如图4所示，包括：

第一采集模块42，用于采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

唤醒模块44，用于在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

第一提取模块46，用于接收第二语音信息，并提取所述第二语音信息对应的操作指令；

第一播放模块48，用于根据所述操作指令播放所述相册。

可选地，所述第一播放模块48包括：

确定子模块，用于根据预先存储的声纹特征与用户标识的对应关系确定所述目标声纹特征对应的目标用户标识；

可选地，所述装置还包括：

第一接收模块，用于接收第三语音信息；

第一识别模块，用于识别所述第三语音信息对应的调整所述播放方式的调整指令；

调整模块，用于根据所述调整指令调整所述播放方式；

第二播放模块，用于根据调整后的播放方式播放所述相册。

可选地，所述装置还包括：

第二采集模块，用于采集用于触发相册的一个或多个语音开锁指令；

第二提取模块，用于提取所述一个或多个语音开锁指令的声纹特征；

第一存储模块，用于将一个或多个声纹特征设置为所述相册的声纹锁，并存储所述一个或多个声纹特征。

可选地，所述装置还包括：

第一设置模块，用于通过显示界面提示设置每个声纹特征的用户标识；

确定模块，用于根据在所述显示界面的交互操作确定每个所述声纹特征对应的用户标识；

第二存储模块，用于存储所述一个或多个声纹特征与用户标识的对应关系。

可选地，所述装置还包括：

第三提取模块，用于提取所述相册中的图片信息，其中，所述图片信息包括以下至少之一：拍摄时间、拍摄地点、图片标签、相册名称；

分类模块，用于根据所述图片信息对所述相册中的图片进行分类，得到多个图片类别；

第二设置模块，用于根据所述多个图片类别分别为所述用户标识设置播放方式。

可选地，所述装置还包括：

第二接收模块，用于接收第四语音信息；

第二识别模块，用于识别所述第四语音信息对应的关闭所述相册的关闭指令；

关闭模块，用于根据所述关闭指令关闭所述相册。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

s1，采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

s2，在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

s3，接收第二语音信息，并提取所述第二语音信息对应的操作指令；

s4，根据所述操作指令播放所述相册。

可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(read-onlymemory，简称为rom)、随机存取存储器(randomaccessmemory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

s1，采集用于唤醒相册的第一语音信息，并提取所述第一语音信息的目标声纹特征；

s2，在所述目标声纹特征与预先存储的一个或多个声纹特征中的一个匹配的情况下，唤醒所述相册；

s3，接收第二语音信息，并提取所述第二语音信息对应的操作指令；

s4，根据所述操作指令播放所述相册。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。