HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种基于智能交通音频输入特征识别的模糊测试数据生成方法与流程

2021-01-28 15:01:46|373|起点商标网
一种基于智能交通音频输入特征识别的模糊测试数据生成方法与流程

本发明属于软件测试领域,特别是涉及到智能交通场景下的音频测试数据生成。通过对智能交通场景下的音频数据进行特征分析,刻画智能交通场景下的音频数据特征,并通过施加具有交通语义的声波扰动,实现针对智能交通场景的测试音频数据生成。



背景技术:

近年来,智能软件技术发展迅速,并在交通驾驶领域得到应用,并贯穿了智能交通系统自上而下多层架构。与传统软件不同,智能交通产业目前尚处于起步阶段,现有的技术标准仍在发展过程中。大规模测试验证、安装认证等问题仍需解决和推进。测试数据是验证系统质量的有效内容,然而,智能交通场景复杂度高,大量高质量的数据采集和处理需要大量的时间和成本。因此,针对智能交通场景下的测试数据生成称为一个重要热点问题。

事实上,模糊测试技术是一种有效对系统安全性进行测试的技术手段,并可以实现大规模数据的自动生成与自动化测试。然而,智能交通场景下的输入种类繁多,结构复杂,这使得传统软件测试过程中实施的测试数据扰动生成方法在对音频数据进行处理时可能破坏其原有的语义信息。

基于上述背景,本发明进一步分析了输入所蕴含的语义特征,并希望生成智能交通场景下更有语义的测试数据。因此,本发明基于音频处理网络中常用的卷积层特征提取的特性,结合只能交通场景中的语音、音乐、环境声等多方面因素,实现基于音频输入特征识别的输入生成方法。



技术实现要素:

本发明要解决的问题是:智能交通软件系统测试数据生成方法尚未成熟,特别是对利用深度学习技术实现的智能交通软件模型。智能软件模型的验证需要大量的测试数据实现对模型的充分测试。然而,现有的测试数据生成方法往往忽视了对输入数据的语义信息的维护,这使得这些方式生成的测试数据往往具有争议,并且可能并不能够体现智能交通场景的领域特征。我们的发明从智能交通场景中采集到的数据入手,结合对输入的特征分析,提出适用于智能交通场景的特征变换方法,实现新的测试数据的生成。

本发明的技术方案为:一种基于智能交通音频输入特征识别的模糊测试数据生成方法,其特征为考虑到只能交通环境的复杂性,从语音、音乐和环境声这三个常见的音频类型触发,对音频输入文件施加变异,进而实现对智能交通场景下的音频测试数据生成。该评估方法包含以下三个模块/步骤:

1)输入特征提取模块:该模块实现的输入特征提取主要通过音频分析中常用的mfcc方法进行提取,构建原始输入的特征表示。在rnn构建的音频处理分析模型中,我们则以其中的状态随时间的转换作为模型的特征表示。

2)音频数据变异模块:深度学习算子的测试依赖大量的为了实现对算子的充分测试,本模块利用基于变异的模糊测试技术,通过引入面向智能交通场景的数据变异方法,对原始的音频文件分别施加语音、音乐和环境声的变异,实现新的音频数据的生成,并对样本的差异进行度量,从而保证生成测试数据的真实性和有效性。

3)数据多样性评估模块:为了确保通过上述音频数据变异方法得到的测试数据的多样性,即测试数据均匀分布在模型空间,并且没有潜在的数据偏倚,本方法使用dtmc模型表征模型内部的状态和行为,并分别以状态和行为的覆盖情况作为测试数据多样性的评判依据。

本发明的特点在于:

1.在智能交通软件测试数据生成中,首次提出基于音频输入特征进行模糊测试数据生成的技术

2.首次提出结合智能交通场景的语音、音乐和环境声的数据变异方法

3.首次通过dtmc模型表征rnn模型内部状态和行为,以其覆盖评估数据的多样性和引导生成方向

附图说明

图1为本发明实施总流程图。

图2为关键步骤2流程图。

图3为关键步骤4流程图。

具体实施方式

以下通过特定的具体的实例说明本发明的实施方式,本领域的技术人员可由本说明书揭露的内容轻易地了解到本发明的其他优点和功效。

本专利实施音频测试数据的生成,主要采用了模糊测试技术,涉及到的具体关键技术有音频特征识别技术、dtmc模型构建技术、变异方法选择技术、数据变异技术、多样性度量技术等。

1.智能交通输入特征候选集构建

在本发明中,我们采用mfcc方法对音频输入的特征进行识别和提取,基于对数梅尔频谱图、恒定q谱图和相位谱构建音频数据模型无关的特征向量。

2.初始数据选择

本发明中使用初始数据选择策略来进一步提高模糊测试的执行效率。在模糊测试执行过每一次迭代过程中,模糊测试引擎会从初始数据集中选取特定的原始数据以进行变异数据生成。初始数据选择的基线为随机选取,即每次通过随机函数从种子集中抽取一个输入。在本方法中,通过每个输入所对应的模型中的状态和状态转换过程,以状态和转换过程差异最大化为目标进行约束求解,选取出该轮迭代所需要使用的初始音频数据。

3.变异方法选择

本发明中使用针对智能交通领域特征的变异方法实现对初始数据的变异。不同的变异方法的选取对当前模糊测试的效果也有直接的联系。在本方法中,通过mcdc方法基于历史执行过程中变异方法的表现选择当前轮合适的变异方法。

4.测试数据生成

本发明中为了使生成的音频数据更具有真实语义,因此本方法不会对音频已有的音频语义做直接的修改。我们以上一步构建出的模型无关特征向量为参考,通过追加语音、音乐或者环境音的形式实现对于数据的修改,实现新的测试数据的生成。

5.数据多样性评估

本发明中为确保生成数据的充分性和多样性,进一步对数据多样性采用状态和行为覆盖的方法进行实现。本方法通过讲音频处理所使用的rnn模型转换成dtmc模型,并记录其中的状态和行为情况,通过dtmc模型状态和行为的覆盖情况作为测试数据多样性的评估标准。

在本实施例中,智能交通音频数据集以车载语音控制为实施背景。搜集了100个适龄司机进行语音控制的数据,并据此构建音频数据的训练机和验证集。我们通过音频追加语音、音乐和环境音的方式,由此生成新的测试数据。特征多样性的度量讲实时反馈当前新生成的测试数据在状态和行为转换的覆盖情况。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 智能交通测试模型
tips