一种智能会议控制方法和装置与流程
本公开涉及计算机技术领域,尤其涉及一种智能会议控制方法和装置。
背景技术:
随着互联网技术的快速发展,音/视频会议的通信方式在用户的生活、工作、学习等多方面广泛普及。
传统音/视频会议的启动以及各种会议功能,依赖于用户对音/视频会议设备的按键操作或者触摸屏操作,对用户有较高的设备操作要求。若用户不会使用音/视频会议设备,或对音/视频会议设备中的功能按键不了解,导致用户无法启动音/视频会议,或无法使用音/视频会议设备可提供的相关会议功能。
因此,亟需一种智能会议控制方法。
技术实现要素:
有鉴于此,本公开提出了一种智能会议控制方法和装置,从而可以实现通过语音指令控制多媒体会议设备提供会议功能服务,有效降低了多媒体会议设备的人机交互门槛,提高了音/视频会议效率。
根据本公开的第一方面,提供了一种智能会议控制方法,所述方法应用于服务端,所述方法包括:接收第一用户输入的语音指令;通过解析所述语音指令确定与所述语音指令匹配的目标会议指令;基于所述目标会议指令控制多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,通过解析所述语音指令确定与所述语音指令匹配的目标会议指令,包括:通过对所述语音指令进行语音识别,将所述语音指令转换为文本指令;通过对所述文本指令进行自然语言理解,在会议指令数据库中确定与所述文本指令匹配的所述目标会议指令,所述会议指令数据库中包括多种会议指令。
在一种可能的实现方式中,所述方法还包括:向多媒体会议设备发送第一提示指令,所述第一提示指令用于控制所述多媒体会议设备对所述多种会议指令进行文本显示,以提示用户进行语音输入。
在一种可能的实现方式中,基于所述目标会议指令控制多媒体会议设备提供对应的会议功能服务,包括:根据所述语音指令确定目标多媒体会议设备;通过所述目标会议指令控制所述目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,所述语音指令是所述第一用户基于多媒体会议设备输入的;根据所述语音指令确定目标多媒体会议设备,包括:接收所述多媒体会议设备发送的所述多媒体会议设备所在目标区域的区域标识;根据所述目标区域的区域标识,将所述目标区域中的所述多媒体会议设备确定为所述目标多媒体会议设备。
在一种可能的实现方式中,所述语音指令是所述第一用户基于智能音箱输入的;根据所述语音指令确定目标多媒体会议设备,包括:确定所述智能音箱对应的音箱标识,所述音箱标识用于指示所述智能音箱所在目标区域的区域标识;将所述目标区域中的多媒体会议设备作为所述目标多媒体会议设备。
在一种可能的实现方式中,所述目标会议指令为会议创建指令;通过所述目标会议指令控制所述目标多媒体会议设备提供对应的会议功能服务,包括:通过所述会议创建指令控制所述目标多媒体会议设备创建目标音/视频会议。
在一种可能的实现方式中,所述方法还包括:为所述目标音/视频会议创建加入会议指令,所述加入会议指令用于指示第二用户通过语音输入所述加入会议指令加入所述目标音/视频会议。
在一种可能的实现方式中,所述方法还包括:根据所述区域标识,确定所述目标区域中无线访问接入点ap的第一媒体接入控制mac地址;根据所述第一mac地址,确定接入所述ap的第二mac地址;根据所述第二mac地址,确定接入所述目标音/视频会议的第三用户的身份信息。
在一种可能的实现方式中,所述目标会议指令为电话呼叫指令,所述电话呼叫指令中包括目标用户标识;通过所述目标会议指令控制所述目标多媒体会议设备提供对应的会议功能服务,包括:确定所述目标用户标识对应的第四用户,以及确定所述第四用户的电话号码;根据所述第四用户的电话号码,通过所述电话呼叫指令控制所述目标多媒体会议设备电话呼叫所述第四用户。
在一种可能的实现方式中,确定所述目标用户标识对应的第四用户,包括:在确定与所述目标用户标识对应的用户存在多个时,根据所述第一用户的身份信息,确定所述多个用户与所述第一用户之间的相关性;将与所述第一用户的相关性超过阈值的用户确定为所述第四用户。
在一种可能的实现方式中,所述方法还包括:从所述语音指令中提取声纹特征;根据所述声纹特征,确定所述第一用户的身份信息。
在一种可能的实现方式中,通过所述目标会议指令控制所述目标多媒体会议设备提供对应的会议功能服务,包括:在确定所述目标会议指令能够被所述目标多媒体会议设备直接响应时,通过所述目标会议指令控制所述目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,所述方法还包括:在确定所述目标会议指令无法被所述目标多媒体会议设备直接响应时,在会议指令数据库中确定与所述目标会议指令对应的关联会议指令,所述关联会议指令能够被所述目标多媒体会议设备直接响应;向所述目标多媒体会议设备发送第二提示指令,所述第二提示指令用于控制所述目标多媒体会议设备对所述关联会议指令进行文本显示和/或语音输出,以提示所述第一用户进行语音输入。
根据本公开的第二方面,提供了一种智能会议控制方法,所述方法应用于多媒体会议设备,所述方法包括:接收第一用户输入的语音指令;通过解析所述语音指令确定与所述语音指令匹配的目标会议指令;向服务端发送所述目标会议指令,以使得所述服务端基于所述目标会议指令提供对应的会议功能服务。
根据本公开的第三方面,提供了一种智能会议控制装置,所述装置应用于服务端,所述装置包括:接收模块,用于接收第一用户输入的语音指令;解析模块,用于通过解析所述语音指令确定与所述语音指令匹配的目标会议指令;控制模块,用于基于所述目标会议指令控制多媒体会议设备提供对应的会议功能服务。
根据本公开的第四方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述第一方面所述的智能会议控制方法。
根据本公开的第五方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述第一方面所述的智能会议控制方法。
根据本公开的第六方面,提供了一种智能会议控制装置,所述装置应用于多媒体会议设备,所述装置包括:接收模块,用于接收第一用户输入的语音指令;解析模块,用于通过解析所述语音指令确定与所述语音指令匹配的目标会议指令;发送模块,用于向服务端发送所述目标会议指令,以使得所述服务端基于所述目标会议指令提供对应的会议功能服务。
根据本公开的第七方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述第二方面所述的智能会议控制方法。
根据本公开的第八方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述第二方面所述的智能会议控制方法。
服务端接收第一用户输入的语音指令,通过解析语音指令确定与语音指令匹配的目标会议指令,进而基于目标会议指令控制多媒体会议设备提供对应的会议功能服务,从而可以实现通过语音指令控制多媒体会议设备提供会议功能服务,有效降低了多媒体会议设备的人机交互门槛,提高了音/视频会议效率。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出本公开一实施例的智能会议控制方法的流程示意图;
图2示出本公开一实施例的智能会议控制系统的示意图;
图3示出本公开一实施例的多媒体会议设备中会议主页的示意图;
图4示出本公开一实施例的目标多媒体会议设备中gui和vui联动的示意图;
图5示出本公开一实施例的多媒体会议设备中dui的示意图;
图6示出本公开一实施例的智能会议控制方法的流程示意图;
图7示出本公开一实施例的智能会议控制装置的结构示意图;
图8示出本公开一实施例的智能会议控制装置的结构示意图;
图9示出本公开一实施例的电子设备的结构示意图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。所属领域技术人员可以理解,和/或表示所连接对象的至少其中之一。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出本公开一实施例的智能会议控制方法的流程示意图。该方法可以应用于服务端,如图1所示,该方法可以包括:
步骤s11,接收第一用户输入的语音指令。
步骤s12,通过解析语音指令确定与语音指令匹配的目标会议指令。
步骤s13,基于目标会议指令控制多媒体会议设备提供对应的会议功能服务。
智能会议控制系统中的服务端接收到第一用户输入的语音指令后,对该语音指令进行解析确定第一用户的用户意图,根据第一用户的用户意图确定与该语音指令匹配的目标会议指令,进而基于该目标会议指令控制多媒体会议设备提供对应的会议功能服务。
图2示出本公开一实施例的智能会议控制系统的示意图。如图2所示,智能会议控制系统中包括:智能音箱、多媒体会议设备、服务端和无线访问接入点(ap,wirelessaccesspoint)。其中,智能音箱、多媒体会议设备和ap部署在会议室中。智能会议控制系统中可以实现会议室中智能音箱、多媒体会议设备和ap的信息联动,以实现为用户提供对应的会议功能服务。
多媒体会议设备可以为音频会议设备、电话会议设备、视频会议设备等,本公开对此不作具体限定。
在一种可能的实现方式中,语音指令是第一用户基于智能音箱输入的。
当处于会议室中的第一用户希望会议室中的多媒体会议设备提供会议功能服务时,第一用户可以通过会议室中的智能音箱向会议控制模块输入语音指令。
在一种可能的实现方式中,语音指令是第一用户基于多媒体会议设备输入的。
在一示例中,可以将智能会议控制系统中的智能音箱与多媒体会议室设备集成在一起,无需使用单独的智能音箱,当处于会议室中的第一用户希望会议室中的多媒体会议设备提供会议功能服务时,第一用户可以通过该多媒体会议设备向服务端输入语音指令。
在一种可能的实现方式中,通过解析语音指令确定与语音指令匹配的目标会议指令,包括:通过对语音指令进行语音识别,将语音指令转换为文本指令;通过对文本指令进行自然语言理解,在会议指令数据库中确定与文本指令匹配的目标会议指令,会议指令数据库中包括多种会议指令。
在一示例中,会议指令数据库可以定期更新。
在一示例中,会议指令数据库可以部署在服务端,当多媒体会议设备接收到第一用户输入的语音指令之后,多媒体会议设备将该语音指令发送至服务端,服务端接收到该语音指令之后,对该语音指令进行解析来确定与该语音指令匹配的目标会议指令。
在一示例中,会议指令数据库可以部署在服务端,当智能音箱接收到第一用户输入的语音指令之后,智能音箱将该语音指令发送至服务端,服务端接收到该语音指令之后,对该语音指令进行解析来确定与该语音指令匹配的目标会议指令。
在一示例中,在智能会议控制系统中增加与智能音箱对应的智能音箱服务器,进而可以将会议指令数据库部署在智能音箱服务器中。当智能音箱接收到第一用户输入的语音指令之后,智能音箱将该语音指令发送至智能音箱服务器,智能音箱服务器对该语音指令进行解析来确定与该语音指令匹配的目标会议指令,进而智能音箱服务器将目标会议指令发送至服务端。
对语音指令进行解析来确定与语音指令匹配的目标会议指令的过程为:通过自动语音识别(asr,automaticspeechrecognition)技术对语音指令进行语音识别,将语音指令转换为文本指令;进而通过自然语言处理(nsp,naturallanguageprocessing)技术对文本指令进行自然语言理解,确定第一用户的用户意图;进而根据第一用户的用户意图,以分词的形式与会议指令数据库中的会议指令进行内容匹配,确定与文本指令匹配的目标会议指令,也即确定与语音指令匹配的目标会议指令。
例如,当第一用户输入语音指令“打电话给a”时,通过对语音指令“打电话给a”进行解析,确定与语音指令“打电话给a”匹配的目标会议指令为电话呼叫指令,电话呼叫指令中包括参数“被叫方”,“a”为参数“被叫方”的赋值。
在一种可能的实现方式中,还包括:从语音指令中提取声纹特征;根据声纹特征,确定第一用户的身份信息。
智能会议控制系统与声纹特征数据库进行了绑定,声纹特征数据库中包括多个用于表示用户身份信息的用户身份标识,以及任一用户身份标识对应的声纹特征,声纹特征数据库可以定期更新。服务端接收到第一用户输入的语音指令之后,从语音指令中提取第一用户的声纹特征,进而将第一用户的声纹特征与声纹特征数据库中的声纹特征进行匹配,根据匹配结果,确定第一用户的身份信息。基于声纹的用户身份识别,使得用户使用多媒体会议设备时,无需主动进行身份验证登录,例如,无需主动输入账号密码,无需进行指纹或刷脸验证,从而可以实现免登录人机交互,提高了多媒体会议设备的使用效率。
在一种可能的实现方式中,还包括:向多媒体会议设备发送第一提示指令,第一提示指令用于控制多媒体会议设备对多种会议指令进行文本显示,以提示用户进行语音输入。
在会议室中的多媒体会议设备启动后,服务端可以向多媒体会议设备发送第一提示指令,多媒体会议设备响应于第一提示指令,可以在多媒体会议设备的会议主页中对会议指令数据库中包括的多种会议指令进行文本显示,以通过多媒体会议设备屏显指引的方式提示用户根据需要进行语音输入。
图3示出本公开一实施例的多媒体会议设备中会议主页的示意图。如图3所示,在会议主页中对三种不同场景(视频会议场景、电话会议场景和会议问答场景)下的多种会议指令进行了文本显示,以提示用户根据需要进行语音输入。例如,当用户需要新建视频会议时,可以根据会议主页中文本显示的会议指令,通过智能音箱语音输入“发起视频会议”。
在一种可能的实现方式中,基于目标会议指令控制多媒体会议设备提供对应的会议功能服务,包括:根据语音指令确定目标多媒体会议设备;通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
智能会议控制系统中包括部署在不同区域的多个多媒体会议设备,会议控制模块接收到第一用户通过智能音箱输入的语音指令之后,根据语音指令确定目标多媒体会议设备,进而通过目标会议指令控制目标多媒体会议设备为第一用户提供对应的会议功能服务。
根据语音指令确定目标多媒体会议设备的方式包括下述至少两种。
第一种:
在一种可能的实现方式中,语音指令是第一用户基于多媒体会议设备输入的;根据语音指令确定目标多媒体会议设备,包括:接收多媒体会议设备发送的多媒体会议设备所在目标区域的区域标识;根据目标区域的区域标识,将目标区域中的多媒体会议设备确定为目标多媒体会议设备。
多媒体会议设备接收到第一用户输入的语音指令之后,将该语音指令以及多媒体会议设备自身所在目标区域的区域标识发送至服务端,使得服务端根据该区域标识,将目标区域中的多媒体会议设备确定为目标多媒体会议设备。
第二种:
在一种可能的实现方式中,语音指令是第一用户基于智能音箱输入的;根据语音指令确定目标多媒体会议设备,包括:确定智能音箱对应的音箱标识,音箱标识用于指示智能音箱所在目标区域的区域标识;将目标区域中的多媒体会议设备作为目标多媒体会议设备。
在一示例中,不同区域可以为不同会议室,则目标区域为目标会议室。
智能音箱接收到第一用户输入的语音指令之后,将该语音指令和智能音箱对应的音箱标识发送至服务端,音箱标识是智能音箱的唯一标识,智能会议控制系统将智能音箱对应的音箱标识与智能音箱所在区域的区域标识进行了绑定。服务端可以根据音箱标识,确定与该音箱标识对应的区域标识,进而确定智能音箱所在的目标区域,以及将目标区域中的多媒体会议设备作为需要为第一用户提供会议功能服务的目标多媒体会议设备。
例如,智能会议控制系统将智能音箱对应的音箱标识与智能音箱所在会议室的会议室标识(roomid)进行了绑定。当第一用户通过智能音箱输入语音指令之后,智能音箱将该语音指令和智能音箱对应的音箱标识发送至服务端,服务端可以根据音箱标识,确定与该音箱标识对应的roomid,进而确定智能音箱所在的目标会议室,以及将目标会议室中的多媒体会议设备作为需要为第一用户提供会议功能服务的目标多媒体会议设备。
在一种可能的实现方式中,通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务,包括:在确定目标会议指令能够被目标多媒体会议设备直接响应时,通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
例如,第一用户语音输入语音指令“打电话给a”,通过对语音指令“打电话给a”进行解析,确定与语音指令“打电话给a”匹配的目标会议指令为电话呼叫指令,“a”为对电话呼叫指令中参数“被叫方”的赋值,该电话呼叫指令能够被目标多媒体会议设备直接响应,此时,通过该电话呼叫指令控制目标多媒体会议设备电话呼叫a。
在一种可能的实现方式中,还包括:在确定目标会议指令无法被目标多媒体会议设备直接响应时,在会议指令数据库中确定与目标会议指令对应的关联会议指令,关联会议指令能够被目标多媒体会议设备直接响应;向目标多媒体会议设备发送第二提示指令,第二提示指令用于控制目标多媒体会议设备对关联会议指令进行文本显示和/或语音输出,以提示第一用户进行语音输入。
当与第一用户输入的语音指令匹配的目标会议指令无法被目标多媒体会议设备直接响应时,服务端在会议指令数据库中确定与目标会议指令对应的且能够被目标多媒体会议设备直接响应的关联会议指令,进而向目标多媒体会议设备发送第二提示指令,第二提示指令用于控制目标多媒体会议设备实现图形用户界面(gui,graphicaluserinterface)、语音用户界面(vui,voiceuserinterface)和对话用户界面(dui,dialogueuserinterface)的联动,对关联会议指令进行文本显示和/或语音输出,以提示第一用户进一步进行语音输入。
图4示出本公开一实施例的目标多媒体会议设备中gui和vui联动的示意图。第一用户输入语音指令“我要开会”,服务端通过解析语音指令“我要开会”确定与语音指令“我要开会”匹配的目标会议指令为会议启动指令。但是,由于不清楚第一用户是需要创建新的音/视频会议,或者是需要加入其他用户已经创建的音/视频会议,或者是需要电话呼叫其他用户进行电话会议。因此,服务端通过第二提示指令控制目标多媒体会议设备实现gui、vui和dui的联动。如图4所示,对语音指令“我要开会”进行文本显示,以及对与目标会议指令(会议启动指令)对应的关联会议指令(“发起视频会议”、“加入会议[加入会议指令]”、“呼叫[电话号码]”和“会议主页”)进行文本显示和/或语音输出,以提示第一用户进一步进行语音输入。
在一示例中,可以通过从文本到语音(tts,texttospeech)技术来实现目标多媒体会议设备的vui,本公开对此不作具体限定。
在一种可能的实现方式中,目标会议指令为会议创建指令;通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务,包括:通过会议创建指令控制目标多媒体会议设备创建目标音/视频会议。
例如,当第一用户输入语音指令“发起视频会议”后,通过对语音指令“发起视频会议”进行解析,确定与语音指令“发起视频会议”匹配的目标会议指令为会议创建指令,此时,服务端通过该会议创建指令控制目标多媒体会议设备创建目标视频会议。
在一种可能的实现方式中,还包括:为目标音/视频会议创建加入会议指令,加入会议指令用于指示第二用户通过语音输入加入会议指令加入目标音/视频会议。
当根据第一用户输入的语音指令,服务端控制目标多媒体会议设备创建目标音/视频会议之后,为了方便需要参加目标音/视频会议的第二用户能够快速加入目标音/视频会议,服务端为目标音/视频会议创建加入会议指令,使得第二用户可以通过所在会议室的智能音箱或多媒体会议设备语音输入该加入会议指令,控制第二用户所在会议室的多媒体会议设备加入目标音/视频会议。
在一示例中,加入会议指令可以为6位数字会议码,本公开对此不作具体限定。
在一示例中,第二用户可以通过所在会议室的多媒体会议设备,或通过自身的移动终端,语音输入或手动输入该加入会议指令,来控制所在会议室的多媒体会议设备,或控制自身的移动终端加入对应的目标音/视频会议,本公开对此不作具体限定。
在一种可能的实现方式中,还包括:根据区域标识,确定目标区域中ap的第一媒体接入控制(mac,mediaaccesscontrol)地址;根据第一mac地址,确定接入ap的第二mac地址;根据第二mac地址,确定接入目标音/视频会议的第三用户的身份信息。
仍以上述图2为例,智能会议控制系统中可以实现目标会议室中多媒体会议设备和ap的信息联动。根据确定的区域标识(目标会议室的roomid)确定目标区域(目标会议室),智能会议控制系统将目标会议室的roomid与目标会议室中ap的第一mac地址进行了绑定,使得可以通过目标会议室的roomid,确定目标会议室中ap的第一mac地址。进而通过监控第一mac地址,确定接入目标会议室中ap的第二mac地址,以及根据第二mac地址,确定接入目标会议室中多媒体会议设备上目标音/视频会议的第三用户的身份信息。
通过目标会议室中ap确定目标音/视频会议的参会人员情况,进而也可以将接入目标音/视频会议的第三用户的身份信息在目标多媒体会议设备上进行gui/vui联动显示,以提示目标音/视频会议的参会详情。
在一种可能的实现方式中,目标会议指令为电话呼叫指令,电话呼叫指令中包括目标用户标识;通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务,包括:确定目标用户标识对应的第四用户,以及确定第四用户的电话号码;根据第四用户的电话号码,通过电话呼叫指令控制目标多媒体会议设备电话呼叫第四用户。
例如,当第一用户输入语音指令“帮我打电话给花花”后,通过对语音指令“帮我打电话给花花”进行解析,确定与语音指令“帮我打电话给花花”匹配的目标会议指令为电话呼叫指令,“花花”为电话呼叫指令中包括的目标用户标识。智能会议控制系统与通讯录数据库进行了绑定,服务端根据目标用户标识“花花”,调用通讯录数据库,确定目标用户标识“花花”对应的第四用户(被叫方),以及确定第四用户的电话号码,进而根据第四用户的电话号码,通过该电话呼叫指令控制目标对媒体会议设备电话呼叫第四用户。
在一种可能的实现方式中,确定目标用户标识对应的第四用户,包括:在确定与目标用户标识对应的用户存在多个时,根据第一用户的身份信息,确定多个用户与第一用户之间的相关性;将与第一用户的相关性超过阈值的用户确定为第四用户。
由于目标用户标识“花花”是第一用户语音输入的信息,若通讯录数据库中与“花花”同音的用户存在多个,则服务端根据第一用户的身份信息,确定多个用户与第一用户之间的相关性,进而将与第一用户的相关性超过阈值的用户确定为第四用户。与第一用户的相关性超过阈值的用户可以表示是第一用户电话呼叫可能性最高的被叫方。通过智能会议控制系统与通讯录数据库的绑定,使得用户无需进行查找电话号码的繁琐操作,可以通过简单的语音输入准确实现与被叫方的通话或视频。
在一示例中,可以通过多个用户与第一用户之间的部门组织关系,或业务关联关系确定其之间的相关性,本公开对此不作具体限定。
在一示例中,智能会议控制系统可以提供会话机器人(chatbot)服务,通过dui为用户提供多媒体会议设备的使用帮助服务,减少人工服务成本。例如,当用户输入语音指令“多媒体会议设备的开关在哪里”时,服务端根据语音指令确定目标会议室,以及确定目标会议室中目标多媒体会议设备的型号信息之后,进一步确定目标多媒体会议设备对应的开机指令,进而服务端将开机指令发送至目标多媒体会议设备,通过dui向用户反馈开机指令,以便用户通过语音输入开机指令来使用目标多媒体会议设备。
图5示出本公开一实施例的多媒体会议设备中dui的示意图。当用户输入语音指令“怎样拨打国际电话”时,服务端在会议指令数据库中确定拨打国际电话的会议指令(“拨打座机:000+国际区号+座机号码”和“拨打手机:000+国际区号+手机号码”),进而如图5所示,控制目标多媒体会议设备对该会议指令进行dui显示,以便于用户进一步执行后续拨打国际电话的语音指令输入,为用户提供会议帮助服务,有效提高用户使用体验。
服务端接收第一用户输入的语音指令,通过解析语音指令确定与语音指令匹配的目标会议指令,进而基于目标会议指令控制多媒体会议设备提供对应的会议功能服务,从而可以实现通过语音指令控制多媒体会议设备提供会议功能服务,有效降低了多媒体会议设备的人机交互门槛,提高了音/时频会议效率。
图6示出本公开一实施例的智能会议控制方法的流程示意图。该方法可以应用于多媒体会议设备,如图6所示,该方法可以包括:
步骤s61,接收第一用户输入的语音指令。
步骤s62,通过解析语音指令确定与语音指令匹配的目标会议指令。
步骤s63,向服务端发送目标会议指令,以使得服务端基于目标会议指令提供对应的会议功能服务。
相比于图1所示的智能会议控制方法,可以对第一用户输入的语音指令在多媒体会议设备中利用边缘算法进行本地解析,在解析确定出目标会议指令之后,向服务端发送目标会议指令,以使得服务端基于目标会议指令提供后续会议功能服务。
对语音指令进行解析的具体过程可参考图1所示实施例中的对语音指令进行解析的具体过程,这里不再赘述。
服务端基于目标会议指令提供对应的会议功能服务的过程可参考图1所示实施例中的服务端基于目标会议指令提供对应的会议功能服务的具体过程,这里不再赘述。
图7示出本公开一实施例的智能会议控制装置的结构示意图。图7所示的装置70可以应用于服务端,装置70可以用于执行上述图1所示方法实施例的步骤,装置70包括:
接收模块71,用于接收第一用户输入的语音指令;
解析模块72,用于通过解析语音指令确定与语音指令匹配的目标会议指令;
控制模块73,用于基于目标会议指令控制多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,解析模块72包括:
语音识别子模块,用于通过对语音指令进行语音识别,将语音指令转换为文本指令;
自然语言理解子模块,用于通过对文本指令进行自然语言理解,在会议指令数据库中确定与文本指令匹配的目标会议指令,会议指令数据库中包括多种会议指令。
在一种可能的实现方式中,装置70还包括:
发送模块,用于向多媒体会议设备发送第一提示指令,第一提示指令用于控制多媒体会议设备对多种会议指令进行文本显示,以提示用户进行语音输入。
在一种可能的实现方式中,控制模块73包括:
确定子模块,用于根据语音指令确定目标多媒体会议设备;
控制子模块,用于通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,语音指令是第一用户基于多媒体会议设备输入的;
确定子模块包括:
接收单元,接收多媒体会议设备发送的多媒体会议设备所在目标区域的区域标识;
第一确定单元,根据目标区域的区域标识,将目标区域中的多媒体会议设备确定为目标多媒体会议设备。
在一种可能的实现方式中,语音指令是第一用户基于智能音箱输入的;
确定子模块包括:
第二确定单元,用于确定智能音箱对应的音箱标识,音箱标识用于指示智能音箱所在目标区域的区域标识;
第三确定单元,用于将目标区域中的多媒体会议设备作为目标多媒体会议设备。
在一种可能的实现方式中,目标会议指令为会议创建指令;
控制子模块具体用于:
通过会议创建指令控制目标多媒体会议设备创建目标音/视频会议。
在一种可能的实现方式中,装置70还包括:
指令创建模块,用于为目标音/视频会议创建加入会议指令,加入会议指令用于指示第二用户通过语音输入加入会议指令加入目标音/视频会议。
在一种可能的实现方式中,装置70还包括:
第一确定模块,用于根据区域标识,确定目标区域中ap的第一mac地址;
第二确定模块,用于根据第一mac地址,确定接入ap的第二mac地址;
第三确定模块,用于根据第二mac地址,确定接入目标音/视频会议的第三用户的身份信息。
在一种可能的实现方式中,目标会议指令为电话呼叫指令,电话呼叫指令中包括目标用户标识;
控制子模块包括:
第三确定单元,用于确定目标用户标识对应的第四用户,以及确定第四用户的电话号码;
控制单元,用于根据第四用户的电话号码,通过电话呼叫指令控制目标多媒体会议设备电话呼叫第四用户。
在一种可能的实现方式中,第三确定单元包括:
第一确定子单元,用于在确定与目标用户标识对应的用户存在多个时,根据第一用户的身份信息,确定多个用户与第一用户之间的相关性;
第二确定子单元,用于将与第一用户的相关性超过阈值的用户确定为第四用户。
在一种可能的实现方式中,装置70还包括:
声纹提取模块,用于从语音指令中提取声纹特征;
第四确定模块,用于根据声纹特征,确定第一用户的身份信息。
在一种可能的实现方式中,控制子模块具体用于:
在确定目标会议指令能够被目标多媒体会议设备直接响应时,通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,控制子模块包括:
第四确定单元,用于在确定目标会议指令无法被目标多媒体会议设备直接响应时,在会议指令数据库中确定与目标会议指令对应的关联会议指令,关联会议指令能够被目标多媒体会议设备直接响应;
控制单元,用于向目标多媒体会议设备发送第二提示指令,第二提示指令用于控制目标多媒体会议设备对关联会议指令进行文本显示和/或语音输出,以提示第一用户进行语音输入。
本公开提供的装置70能够实现图1所示方法实施例中的各个步骤,并实现相同的技术效果,为避免重复,这里不再赘述。
图8示出本公开一实施例的智能会议控制装置的结构示意图。图8所示的装置80可以应用于多媒体会议设备,装置80可以用于执行上述图6所示方法实施例的步骤,装置80包括:
接收模块81,用于接收第一用户输入的语音指令;
解析模块82,用于通过解析语音指令确定与语音指令匹配的目标会议指令;
发送模块83,用于向服务端发送目标会议指令,以使得服务端基于目标会议指令提供对应的会议功能服务。
图9示出本公开一实施例的电子设备的结构示意图。如图9所示,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成智能会议控制装置。处理器,执行存储器所存放的程序,并具体执行:接收第一用户输入的语音指令;通过解析语音指令确定与语音指令匹配的目标会议指令;基于目标会议指令控制多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,处理器被具体配置为执行:通过对语音指令进行语音识别,将语音指令转换为文本指令;通过对文本指令进行自然语言理解,在会议指令数据库中确定与文本指令匹配的目标会议指令,会议指令数据库中包括多种会议指令。
在一种可能的实现方式中,处理器被具体配置为执行:向多媒体会议设备发送第一提示指令,第一提示指令用于控制多媒体会议设备对多种会议指令进行文本显示,以提示用户进行语音输入。
在一种可能的实现方式中,处理器被具体配置为执行:根据语音指令确定目标多媒体会议设备;通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,语音指令是第一用户基于多媒体会议设备输入的;处理器被具体配置为执行:接收多媒体会议设备发送的多媒体会议设备所在目标区域的区域标识;根据目标区域的区域标识,将目标区域中的多媒体会议设备确定为目标多媒体会议设备。
在一种可能的实现方式中,语音指令是第一用户基于智能音箱输入的;处理器被具体配置为执行:根据语音指令确定目标多媒体会议设备,包括:确定智能音箱对应的音箱标识,音箱标识用于指示智能音箱所在目标区域的区域标识;将目标区域中的多媒体会议设备作为目标多媒体会议设备。
在一种可能的实现方式中,目标会议指令为会议创建指令;处理器被具体配置为执行:通过会议创建指令控制目标多媒体会议设备创建目标音/视频会议。
在一种可能的实现方式中,处理器被具体配置为执行:为目标音/视频会议创建加入会议指令,加入会议指令用于指示第二用户通过语音输入加入会议指令加入目标音/视频会议。
在一种可能的实现方式中,处理器被具体配置为执行:根据区域标识,确定目标区域中ap的第一mac地址;根据第一mac地址,确定接入ap的第二mac地址;根据第二mac地址,确定接入目标音/视频会议的第三用户的身份信息。
在一种可能的实现方式中,目标会议指令为电话呼叫指令,电话呼叫指令中包括目标用户标识;处理器被具体配置为执行:确定目标用户标识对应的第四用户,以及确定第四用户的电话号码;根据第四用户的电话号码,通过电话呼叫指令控制目标多媒体会议设备电话呼叫第四用户。
在一种可能的实现方式中,处理器被具体配置为执行:在确定与目标用户标识对应的用户存在多个时,根据第一用户的身份信息,确定多个用户与第一用户之间的相关性;将与第一用户的相关性超过阈值的用户确定为第四用户。
在一种可能的实现方式中,处理器被具体配置为执行:从语音指令中提取声纹特征;根据声纹特征,确定第一用户的身份信息。
在一种可能的实现方式中,处理器被具体配置为执行:在确定目标会议指令能够被目标多媒体会议设备直接响应时,通过目标会议指令控制目标多媒体会议设备提供对应的会议功能服务。
在一种可能的实现方式中,处理器被具体配置为执行:在确定目标会议指令无法被目标多媒体会议设备直接响应时,在会议指令数据库中确定与目标会议指令对应的关联会议指令,关联会议指令能够被目标多媒体会议设备直接响应;向目标多媒体会议设备发送第二提示指令,第二提示指令用于控制目标多媒体会议设备对关联会议指令进行文本显示和/或语音输出,以提示第一用户进行语音输入。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备可执行图1所示方法实施例执行的方法,并实现上述图1所示方法实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图1所示实施例中的智能会议控制方法,并具体执行图1所示方法实施例的步骤。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除