一种车载语音交互系统的响应时间测试系统、方法及设备与流程

2021-01-28 17:01:10|

404|

起点商标网

本发明涉及实车语音测试领域，具体涉及一种车载语音交互系统的响应时间测试系统、方法及设备。
背景技术：
：语音识别是车载语音交互系统获取用户意图的重要途径，比如，用户可以在不方便直接操控车载语音交互系统的情况下说出语音指令来进行控制。语音识别可以包括初步的唤醒和后续的识别这两个过程。随着主机厂、科技公司、初创公司等纷纷加入智能车载语音交互市场的大河，车载语音交互系统的软硬件性能以及系统的功能、质量都无法保证，在出厂前都需要进行测试，需要测量其响应语音指令的时间，从而根据该响应时间判断该车载语音交互系统是否合格、将其划分等级或用于后期研究等。目前车载语音交互系统的响应时间测试基本在实验室进行，仅基于零部件级(未装载在实车中)，但在装车以后受车辆行驶环境、行驶状态等影响，其与在实验室的测试结果往往有明显的不同，这种测试方法不能体现车载语音交互系统的实际性能。技术实现要素：本发明提供一种车载语音交互系统的响应时间测试系统、方法及设备，解决的技术问题在于：零部件级的实验室内车载语音交互系统响应时间测试方法不能满足实际驾驶状态要求，测试结果与实车表现有差异，不能体现车载语音交互系统的实际性能。本发明提供的基础方案为：一种车载语音交互系统的响应时间测试系统，包括语音指令控制模块、系统响应采集模块和分析处理模块；所述语音指令控制模块用于生成预设语音交互指令，并向装载在实车中的车载语音交互系统输入；所述系统响应采集模块用于采集在一所述预设语音交互指令完成输入后所述车载语音交互系统的响应信息；所述分析处理模块用于获取所述响应信息，并根据所述响应信息计算本次测试所述车载语音交互系统的响应时间。本基础方案：按照预设语音交互指令(比如开启导航、播放音乐、打电话等)控制装载在实车中的车载语音交互系统，根据车载语音交互系统的响应信息来计算其响应时间，相比零部件级的实验室测试方法，则更能反映用户的真实使用环境。在进一步的实施方案中，所述系统响应采集模块包括图像采集模块和声音采集模块；所述图像采集模块用于采集所述车载语音交互系统呈现的画面并向所述分析处理模块输入；所述声音采集模块用于采集所述车载语音交互系统发出的声音并向所述分析处理模块输入。本方案：基于车载语音交互系统响应预设语音交互指令的外在表现形式有声音、画面两种，采用图像采集模块、声音采集模块来分别采集车载语音交互系统发出的声音和呈现的画面，相比直接探测信号流的方式，更能从用户层面反映车载语音交互系统的实际响应情况。在进一步的实施方案中，所述根据所述响应信息计算本次测试所述车载语音交互系统的响应时间具体包括：将所述响应信息的采集开始时刻作为响应时间的开始点；分析所述响应信息中是否出现对应所述预设语音交互指令的执行动作特征点，若是则将所述执行动作特征点出现的时间作为响应时间的结束点，若否则将此次测试标记为无响应；将所述开始点与所述结束点作差，得到对应的响应时间。本方案站在用户角度，进一步限定响应时间的计算规则为从响应信息的采集开始时刻(也是预设语音交互指令的输出结束时刻)起算，到出现对应的执行动作特征点结算，符合一般用户对响应时间的认知，便于从用户层面直接反映车载语音交互系统的实际响应情况。在进一步的实施方案中，所述预设语音交互指令包括第一-第三类语音指令，分别为语音响应指令、画面响应指令、综合响应指令，对应的所述执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。本方案将预设语音交互指令分为三类，分别是语音响应指令、画面响应指令、综合响应指令，作用在车载语音交互系统对应的响应为只发出声音、只呈现画面和声音、画面同时出现，作用在分析处理模块分析得到的执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。从而根据不同的预设语音交互指令，分析模块采用对应的分析策略，测量的响应时间更加精准。在进一步的实施方案中，所述图像采集模块采用高帧工业相机，所述声音采集模块采用拾音器。本方案进一步限定图像采集模块采用高帧工业相机，利用其高帧、高分辨率的拍摄优点，将车载语音交互系统出现画面的实际时间和高帧工业相机的抓拍时间之间的时间误差缩小到忽略不计，保证了采集响应画面的实时性，提高了测量的响应时间的准确性；限定声音采集模块采用拾音器，利用拾音器这一专业声音采集设备的采集迅速、高保真的优点，将车载语音交互系统发出声音的实际时间和拾音器的采集时间之间的时间误差缩小到忽略不计，保证了采集响应时间的实时性，提高了测量的响应时间的准确性。本方面还提供一种车载语音交互系统响应时间测试方法，其基础方案为：一种车载语音交互系统响应时间测试方法，包括步骤：s1.生成预设语音交互指令，并向装载在实车中的车载语音交互系统输入；s2.采集在一所述预设语音交互指令完成输入后所述车载语音交互系统的响应信息；s3.根据所述响应信息计算本次测试所述车载语音交互系统的响应时间。本基础方案：按照预设语音交互指令(比如开启导航、播放音乐、打电话等)控制装载在实车中的车载语音交互系统(s1)，根据车载语音交互系统的响应信息来计算其响应时间(s2、s3)，相比零部件级的实验室测试方法，则更能反映用户的真实使用环境。在进一步的实施方案中，所述响应信息包括所述车载语音交互系统呈现的画面和发出的声音。基于车载语音交互系统响应预设语音交互指令的外在表现形式有声音、画面两种，本方案分别采集车载语音交互系统发出的声音和呈现的画面，相比直接探测信号流的方式，更能从用户层面反映车载语音交互系统的实际响应情况。在进一步的实施方案中，所述步骤s3具体包括：s31.将所述响应信息的采集开始时刻作为响应时间的开始点；s32.分析所述响应信息中是否出现对应所述预设语音交互指令的执行动作特征点，若是则将所述执行动作特征点出现的时间作为响应时间的结束点并进入步骤s33，若否则将此次测试标记为无响应；s33.将所述开始点与所述结束点作差，得到对应的响应时间。本方案站在用户角度，进一步限定响应时间的计算规则为从响应信息的采集开始时刻(也是预设语音交互指令的输出结束时刻)起算，到出现对应的执行动作特征点结算，符合一般用户对响应时间的认知，便于从用户层面直接反映车载语音交互系统的实际响应情况。在进一步的实施方案中，所述预设语音交互指令包括第一-第三类语音指令，分别为语音响应指令、画面响应指令、综合响应指令，对应的所述执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。本方案将预设语音交互指令分为三类，分别是语音响应指令、画面响应指令、综合响应指令，作用在车载语音交互系统对应的响应为只发出声音、只呈现画面和声音、画面同时出现，作用在分析处理模块分析得到的执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。从而根据不同的预设语音交互指令，分析模块采用对应的分析策略，测量的响应时间更加精准。本发明还提供一种测试设备，所述测试系统中所述的语音指令控制模块、系统响应采集模块和分析处理模块中的至少一种模块。该测试设备是将语音指令控制模块、系统响应采集模块和分析处理模块单独做成设备，或者随意结合做成的各种设备，也都是上述方法、系统在实施时的具象。本发明还提供一种存储介质，其上存储有计算机程序，所述计算机程序用于被上述测试系统或测试设备加载，以实现上述语音响应时间测试方法。其中，存储介质可以是磁碟、光盘、只读存储器(readonlymemory，rom)或者随机存取器(randomaccessmemory，ram)等。附图说明图1为本发明实施例1提供的一种车载语音交互系统的响应时间测试系统的模块结构图；图2为本发明实施例2提供的一种车载语音交互系统的响应时间测试系统的步骤流程图。具体实施方式下面通过具体实施方式进一步详细的说明：实施例1为高效且准确地测试得到实车环境下车载语音交互系统的响应时间，如图1所示，本实施例提供一种车载语音交互系统响应时间测试方法，包括步骤s1-s5。s1.生成预设语音交互指令，并向装载在实车中的车载语音交互系统输入。本步骤具体包括：s11.创建语音交互指令集，所述语音交互指令集包括第1-第m预设语音交互指令，并划分为第一-第三类语音指令三种类别，分别为语音响应指令、画面响应指令、综合响应指令；s12.向所述车载语音交互系统第1次输入所述第1预设语音交互指令；s13.等待后续步骤s2、s3完成；s14.向所述车载语音交互系统第2次输入所述第1预设语音交互指令，并再次执行所述步骤s13，直到向所述车载语音交互系统第n次输入所述第1预设语音交互指令，并完成所述步骤13后进入下一步；s15.按照与所述步骤s12-s14相同的处理过程完成所述第2-第m预设指令向所述车载语音交互系统的各n次输出，m≥5，n≥100。本步骤创建语音交互指令集，包括第1-第m预设语音交互指令，可针对不同的语音交互功能进行测试，比如开启导航、播放音乐、打电话等，测试更为全面；针对每一预设语音交互指令，都测试上百次(n≥100，不同的唤醒指令可以选择测试不同次数)，而测试次数越多，计算的响应时间就越准确，但测试次数越多，工作量也越大。实际测试时，可根据具体的车载语音交互系统和测试需求而定。本实施例中，输入预设语音交互指令是指以预设方位向车载语音交互系统播报所述预设语音交互指令。s2.采集在一所述预设语音交互指令完成输入后所述车载语音交互系统的响应信息。在本步骤中，所述响应信息包括所述车载语音交互系统呈现的画面和发出的声音。针对语音响应指令、画面响应指令、综合响应指令，采集的信息则分别为发出的声音、呈现的画面和发出的声音加呈现的画面。本实施例步骤s1、s2的测试情况如下表1所示。表1预设语音交互指令(m＝6)指令功能指令类别测试次数响应信息第1预设语音交互指令导航去xx综合响应指令100语音提示+导航界面第2预设语音交互指令打开收音机画面响应指令100收音机界面第3预设语音交互指令播放歌曲xx综合响应指令100播放界面+音乐声第4预设语音交互指令打电话给xx画面响应指令100通话界面第5预设语音交互指令播报天气语音响应指令100温度播报声第6预设语音交互指令播报新闻语音响应指令100新闻播报声s3.根据所述响应信息计算本次测试所述车载语音交互系统的响应时间。该步骤具体包括：s31.将所述响应信息的采集开始时刻(也是预设语音交互指令的输出结束时刻)作为响应时间的开始点；s32.分析所述响应信息中是否出现对应所述预设语音交互指令的执行动作特征点，若是则将所述执行动作特征点出现的时间作为响应时间的结束点并进入步骤s33，若否则将此次测试标记为无响应；s33.将所述开始点与所述结束点作差，得到对应的响应时间。在步骤s32中，响应时间的结束点如何理解？针对不同类别的语音交互指令，则有不同的设定。针对语音响应指令，开始采集到正确声音的时刻作为响应时间的结束点。所谓正确声音，即是，与预设语音响应指令相匹配的响应声音。以第5预设语音交互指令(“播报天气”)为例，相匹配的响应声音是“好的，即将为您播报今日天气”，若车载语音交互系统发出的声音正与之相匹配，则为所述“正确声音”，“开始采集到正确声音的时刻”即为发出“好”这个字的时刻。需要说明的是，若在预设的时间段比如5s内并未采集到正确的声音，则此次测试标记为未响应，则无需确定响应时间的结束点，也无需计算对应的响应时间。针对画面响应指令，开始采集到正确画面的时刻作为响应时间的结束点。所谓正确画面，即是，与预设语音响应指令相匹配的响应画面。以第4预设语音交互指令(“打电话给xx”)为例，相匹配的画面是拨打界面，若车载语音交互系统切换的画面正与之相匹配，则为所述“正确画面”，“开始采集到正确画面的时刻”即为切换到拨打界面的时刻。需要说明的是，若在预设的时间段比如5s内并未采集到正确的画面，则此次测试标记为未响应，则无需确定响应时间的结束点，也无需计算对应的响应时间。针对综合响应指令(同时采集声音和画面)，响应时间的结束点的选取则相对复杂。根据设定，若开始采集到正确声音和开始检测到正确画面的时间差在预设范围内，则以两者在先的时刻作为响应时间的结束点，相反，若超出了预设范围，则以两者在后的时刻作为响应时间的结束点。需要说明的是，若在预设的时间段比如5s内并未采集到正确的声音和画面，则此次测试标记为未响应，则无需确定响应时间的结束点，也无需计算对应的响应时间。本实施例站在用户角度，进一步限定响应时间的计算规则为从响应信息的采集开始时刻(也是预设语音交互指令的输出结束时刻)起算，到出现对应的执行动作特征点结算，符合一般用户对响应时间的认知，便于从用户层面直接反映车载语音交互系统的实际响应情况。s4.统计每一预设语音交互指令的各响应时间。针对第1-第6预设语音交互指令，本实施例都是测试100次，则就有对应的100个结果，若在预设时间段内如5s正确响应，则就有对应的响应时间，若未正确响应，则就被标记为未响应。以第一预设语音交互指令(导航去xx)为例，本步骤统计的响应时间情况如下表2，“-”表示未响应。表2s5.根据步骤s4统计的结果计算对应的响应时间平均值和不响应率等。以第一预设语音交互指令(导航去xx)为例，本步骤对上表2的数据做了计算，得到对应的响应时间平均值p和不响应率f。p＝236.24/97≈2.44，f＝3/100＝3％。根据实际的使用需求，还可根据表2的数据计算任意参数，比如方差，可表示测得的响应时间的波动情况，反映车载语音交互系统的稳定性。综上所述，本实施例提供的一种车载语音交互系统响应时间测试方法，按照预设语音交互指令(比如开启导航、播放音乐、打电话等)控制装载在实车中的车载语音交互系统，根据车载语音交互系统的响应信息来计算其响应时间，相比零部件级的实验室测试方法，则更能反映用户的真实使用环境。实施例2本实施例中说明书附图中的附图标记包括：语音指令控制模块10、系统响应采集模块20、分析处理模块30、车载语音交互系统40、图像采集模块21、声音采集模块22。参见图2，一种车载语音交互系统的响应时间测试系统，包括语音指令控制模块10、系统响应采集模块20和分析处理模块30；所述语音指令控制模块10用于生成预设语音交互指令，并向装载在实车中的车载语音交互系统40输入；所述系统响应采集模块20用于采集在一所述预设语音交互指令完成输入后所述车载语音交互系统40的响应信息；所述分析处理模块30用于获取所述响应信息，并根据所述响应信息计算本次测试所述车载语音交互系统40的响应时间。在本实施例中，所述系统响应采集模块20包括图像采集模块21和声音采集模块22；所述图像采集模块21用于采集所述车载语音交互系统40呈现的画面并向所述分析处理模块30输入；所述声音采集模块22用于采集所述车载语音交互系统40发出的声音并向所述分析处理模块30输入。本实施例基于车载语音交互系统40响应预设语音交互指令的外在表现形式有声音、画面两种，采用图像采集模块21、声音采集模块22来分别采集车载语音交互系统40发出的声音和呈现的画面，相比直接探测信号流的方式，更能从用户层面反映车载语音交互系统40的实际响应情况。在本实施例中，所述根据所述响应信息计算本次测试所述车载语音交互系统40的响应时间具体包括：将所述响应信息的采集开始时刻作为响应时间的开始点；分析所述响应信息中是否出现对应所述预设语音交互指令的执行动作特征点，若是则将所述执行动作特征点出现的时间作为响应时间的结束点，若否则将此次测试标记为无响应；将所述开始点与所述结束点作差，得到对应的响应时间。这些处理过程与实施例1所述的方法对应，本实施例不再赘述。在本实施例中，所述预设语音交互指令包括第一-第三类语音指令，分别为语音响应指令、画面响应指令、综合响应指令，对应的所述执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。同样，与实施例1所述的方法对应，本实施例不再赘述。本实施例的语音指令控制模块10将预设语音交互指令分为三类，分别是语音响应指令、画面响应指令、综合响应指令，作用在车载语音交互系统40对应的响应为只发出声音、只呈现画面和声音、画面同时出现，作用在分析处理模块30分析得到的执行动作特征点分别为语音响起、画面正确切换、语音响起且画面正确切换。从而根据不同的预设语音交互指令，分析模块采用对应的分析策略，测量的响应时间更加精准。在本实施例中，所述图像采集模块21采用高帧工业相机，所述声音采集模块22采用拾音器。高帧工业相机选用德国optronis公司的cp80-25-m/c-72，拾音器选用烽火电子的hd-18y/v桌面型拾音器(全向)。本实施例进一步限定图像采集模块21采用高帧工业相机，利用其高帧、高分辨率的拍摄优点，将车载语音交互系统40出现画面的实际时间和高帧工业相机的抓拍时间之间的时间误差缩小到忽略不计，保证了采集响应画面的实时性，提高了测量的响应时间的准确性；限定声音采集模块22采用拾音器，利用拾音器这一专业声音采集设备的采集迅速、高保真的优点，将车载语音交互系统40发出声音的实际时间和拾音器的采集时间之间的时间误差缩小到忽略不计，保证了采集响应时间的实时性，提高了测量的响应时间的准确性。在本实施例中，所述语音指令控制模块10和分析处理模块30均为搭载有软件的硬件模块，本实施例采用的为上位机，高帧工业相机和拾音器通过各自的数据线连接该上位机，以实时传输各自采集的视频画面和声音。更具体的，该上位机安装有语音指令生成模拟软件，可模拟男人、女人、大人、小孩等不同类型人类的声音，并可设置声音的输出分贝值、语速大小、高低频率等，并且还采集了全国各地的方言和外国语进行学习，从而可模拟除普通话以外的各地方言以及外国语言，以满足不同的语音交互测试需求。所述上位机还安装有分析处理软件，该软件对高帧工业相机和拾音器采集的数据进行分析，具体的分析处理过程则如实施例1所述，本实施例不再赘述。但是需要补充说明的是，分析过程中所用到的预设时间段的设置、判定是否为正确声音或正确画面是基于该软件已经提前存储好相关的正确声音和正确画面用于比对。针对每一款车载语音交互系统，在本实施例中，输入的每一条语音交互指令，都有对应的响应信息，且该信息是唯一响应，任何情况下输入该语音交互指令，其正确的响应都是唯一的。如此，可保证响应时间测量的准确性。综上所述，本实施例提供的一种车载语音交互系统的响应时间测试系统，按照预设语音交互指令(比如开启导航、播放音乐、打电话等)控制装载在实车中的车载语音交互系统40，根据车载语音交互系统40的响应信息来计算其响应时间，相比零部件级的实验室测试方法，则更能反映用户的真实使用环境。本实施例所提供的测试系统采用各个模块实现测试方法中的各个步骤，为测试方法提供硬件基础，便于方法实施。实施例3本实施例提供一种测试设备，至少包括实施例2中测试系统中所述的语音指令控制模块10、图像采集模块21、声音采集模块22、分析处理模块30中的一种模块。也即，将这些模块一一单独做成设备，或者随意结合做成的各种设备，也都是上述方法在实施时的具象。本实施例和实施例2的差别在于，本实施例侧重于保护一种设备，目的是保护结构的完整性。比如普通的台式电脑办公系统包括显示模块和运算模块。而显示器作为显示模块的具象是一种设备，机箱作为运算模块的一种具象也是一种设备。也即，本实施例保护实施例1中任意一种模块单独做成的设备，也保护任意两种、三种或全四种集成在一起的设备。作为一种优选的实施方式，本实施例的测试设备，主要是基于上位机搭建，语音指令控制模块10是电脑上搭载的软件，其可自动生成各种预设语音交互指令，还能进行播报；图像采集模块21是通过数据线连接上位机的高帧工业相机，与上位机进行画面的实时传输；声音采集模块22是通过数据线连接上位机的录音器，与上位机进行声音的实时传输；分析处理模块30也是电脑上搭载的分析软件，可保存高帧工业相机、录音器实时传输而至的画面、声音，并将这些信息与预存的响应信息作比对，若比对通过，则进一步计算响应时间，若比对失败，则标记为系统未响应。该分析软件还具有数据处理功能，包括求和、求平均值、求方差、标准差，计算某一预设语音交互指令的未响应率或响应率等，并且还可生成响应的图表、报表等。实施例4本实施例还提供一种存储介质，其上存储有计算机程序，所述计算机程序用于被上述实施例2所述的语音响应时间测试系统或实施例3所述测试设备加载，以实现上述实施例1所述的语音响应时间测试方法。其中，存储介质可以是磁碟、光盘、只读存储器(readonlymemory，rom)或者随机存取器(randomaccessmemory，ram)等。以上所述的仅是本发明的实施例，方案中公知的具体结构及特性等常识在此未作过多描述，所属领域普通技术人员知晓申请日或者优先权日之前发明所属
技术领域：
所有的普通技术知识，能够获知该领域中所有的现有技术，并且具有应用该日期之前常规实验手段的能力，所属领域普通技术人员可以在本申请给出的启示下，结合自身能力完善并实施本方案，一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出，对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准，说明书中的具体实施方式等记载可以用于解释权利要求的内容。当前第1页1 2 3

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。