HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

智能语音技术支持的中医闻声诊自动化系统的制作方法

2021-01-28 14:01:56|348|起点商标网
智能语音技术支持的中医闻声诊自动化系统的制作方法

本专利涉及的领域有:中医学、中医诊断方法自动化设计领域,信号分析、信息集成领域,智能识别领域。



背景技术:

原子的共振频率大约为1015hz,而到了分子级别,就降低到了分子是以大约109赫兹,随着体积的增大,其物理振动的频率越低。身体组织、器官和细胞,都维持着一定的振动频率,而脏腑器官的频率范围,则主要在次声范围(1-20hz)。人的语音过程,虽然是由喉咙声带作为主要振动部位,但实际上却是机体整个身体按照其物理属性完成谐振的过程。也正因为如此,人的语音才会具有身份性的特征,能够通过语音判别个体的身份。但是这部分共振特征本身具有的健康意义尚未被现代医学所挖掘。

语音信息的现代医学应用主要在人耳可听得到的范围(20-8000hz),目前已有能力应用于发音器官的功能评价。比如目前已经开发应用于少儿声带发育不全诊断评估,以及气管环切手术的术后康复评价,语音障碍患者治疗前和治疗后声音与听觉知觉分析等检查与评估。利用人工智能,发展出的模式识别可以分辩情绪、心理状态,支持诸如抑郁症,社交恐惧症,焦虑症、双向情感障碍等精神性疾病的诊断,并预测样本是否存在躁狂行为或者是自杀倾向。但是在低频范围的分析较少,首先是因为该频率范围的振动能量较低,检测不易。其次是次声波的穿透性强,很难识别哪一些语音中所携带的次声分量。再者,现代医学尚未将该部分信息的诊断价值进行挖掘,因此,导致了该部分信息被现代科学无意忽略掉了。

中医本身也并没有“共振”这一概念,但是中医诊断过程体验到的低频特征,却表达在很多诊断方法中,被描述为一种能够意会感知到的主观体验。以脉诊为例,诊脉过程中常常体验到一种莫名的“感觉”,像是叠加在脉搏心率之上的更高频率的振动,这种振动就在低频范围,可以被人的手指压力传感器所感知。而通过分析这部分的波动特征,即频率分布特点,可以辨识脏腑功能。

人的语音、心跳、呼吸等,均以人为信号源,因此在发生表达的过程中,均会携带关于机体所有的信息。如果脉诊信息具有低频属性可以支持诊断,那么语音信号中的低频分量同样也能够支持诊断。因此通过设计该频段下的语音特征,能够在另一角度支持中医诊断过程。并发现机体的频率属性。作为诊断经验传承下来。挖掘该部分信息与健康相关的特征,可以支持数字化的诊断。



技术实现要素:

本发明专利名称为语音信号的中医生理模型及闻声诊系统,简称闻声诊系统或英文voicediagnosis,设计版本为v1.0版本。系统的设计原理基于人体的物理共振效应、以原始语音信号为输入段,并通过频域拓展(1-20000hz),获取人语音样本中的特定低频信号,实现语音的脏腑物理属性判定及数据输出。系统由语音信号输入端,语音自动识别vad模块,语音特征因子生成与分析模块,辅助信息支持模块,中医综合辨识模块组成;装置可基于语音得出八纲、三焦、气血津液以及脏腑辨证结论。

其整体工作流程如下:(1)输入语音与个人相关信息,语音经信息输入端,转化为原始音频信号,填入信息经辅助信息支持模块转化为中医理论相应的指标数据;(2)原始音频信号经语音自动识别vad模块区分语音与噪音段,经过语音特征因子生成与分析模块分析语音时域、频域以及复合域特征,形成语音特征因子;(3)语音特征因子经中医综合辨识模块完成中医诊断相关特征指标转化,形成包括五音五行、脏腑、三焦、八纲、气血津液辨证的量化辨证数据,信息整合后生成中医闻声诊综合辨证结论;(4)中医综合辨识模块调用个人相关信息与语音结论进行比对,形成信度报告,在高信度结论中形成配套的干预方案。

1.宽频域的语音模型方法设计

闻声诊系统的语音信号输入端硬件为宽频域设计,其设计对应的生理发音模型为创新的共振语音模型,包括激励模型u(z)、声道模型g(z)与辐射模型r(z)、与共振模型r(z)四个组成部分;将音频叠加的低频(1-20hz)分量归属于共振模型r(z)。

传统语音模型为通过生理分析实现的认知:将语音信号分解为激励模型、声道模型与辐射模型三个组成部分。

s(z)=u(z)·g(z)·r(z)

激励模型u(z):发浊音时声带的不断开启和关闭将产生间歇的脉冲波。这个脉冲波类似于斜三角形脉冲串。发清音时,可等效成随机白噪声。

声道模型g(z):声道部分的数学模型目前有两种观点,一种是将声道视为多个不同截面积的管子串联而形成的系统,即“声管模型”,另一种是将声道视为一个谐振腔,即“共振峰模型”。

辐射模型r(z):辐射模型表征口和唇的辐射效应和圆形头部的绕射效应。

通过中医思维对人体语音功能发音信息的延展,本系统的原理设计部分创新提出中医思维下的语音共振模型:将传统语音信号的数字模型更新为激励模型、声道模型,辐射模型与腹腔共振下的共振腔模型四个组成部分。共振腔依其频段分为可听波段与次声波频段。公式如下:

s(z)=u(z)·g(z)·r(z)·a(z)

前三者与上式相同,第四项腹腔共振模型a(z)为不同器官的本征频率及其倍频效应在语音激励源作用下实现的相关频率的振动强化。利用该创新模型,即可以从语音信号中提取次声波段信号,完成脏腑共振部分的信息提取。

2.语音特征因子转化

语音信号获取后,经语音自动识别vad模块识别语音分量,进一步经语音特征因子生成与分析模块,提取具有诊断价值的语音因子,分为整体信息特征与局部特征两方面,其中整体分析模块获取的信息有:mel频谱特征图、梅尔倒谱系数(melfrequencycepstralcoefficientsmfcc),主频率(dominantfrequencydf),平均频率以及频域中心(perceptualspectralps),功率谱特征(fbes);信噪比,以100.5hz,215.7hz,345.5hz,492.0hz,655.3hz,839.6hz,1048.9hz,1285.5hz,1551.4hz,1850.8hz,2190.0hz,2571.1hz,3000.3hz,3483.9hz,4030.4hz,4645.9hz,5338.9hz,6122hz,7005.5hz,8000.0hz为端点频率分割的语音能量曲线;最高五项共振峰,包络特征,音能时序波动频域特征;同步计算语音信号的帧间频率分布及帧移时序波动特征。

局部特征分析模块采用vad技术精确标注语音区间,实现单字特征分析。获取的信息有:汉字发音单字音素持续时间,音调、音色、音强,汉字发音区段过零率(zcr),频谱曲线的功率谱密度、平坦度、倾斜度以及峰度特征;时域曲线的单字分量的均值、中位数、标准差,离散区间,字间间距,波动趋势以及最小值与最大值;并获取语音人汉字发音功率模型与节律模型,完成语速、语调复杂度分析;基于时频交联分析技术支持,完成对情志、情绪分类以及语气、语态识别,配套环境噪音分量、低频特征分析,获取全方位,富视角信息支持下的语音关键特征因子数据集合。

3.中医辩证方法

语音特征因子生成与分析模块输出的语音因子指标,经中医综合辨识模块可实现智能辨证。中医综合辨识模块纳入中医五音五行、脏腑、三焦、八纲、气血津液辨证理论,并基于语音信号的特殊性,可实现语音辩证。方法如下:(1)三焦辨证法,通过分析喉式发音、胸式发音、腹式发音的语音模式,评价样本在正常说话过程中主要采用的发音方法,用与判别语音过程三焦气机的分布;(2)五音脏腑辩证法,利用可听阈范围内的角徵宫商羽五音特征,识别个体的五音,完成基于五音的个体偏性基础,形成五音脏腑辨证体系;(3)气血津液辨证法,分离语音中的‘噪音’分量,评估机体津液状态,联合语音音量、频率共振峰与频域分布,判别样本气血虚实与津液输布状态;(4)八纲辩证法,分析单字发音的重音位置,获取样本“寒热表里”特征,分析五音语调,判别“升降”特性,分析语音能量分布,判断样本“中气虚实”;(5)提取汉字的发音速度,获取情志“急慢”特征;(6)计算语音时序频率的复杂性,分析样本语言情感的表述丰度。

4.辅助信息支持模块的信息支持

为了强化该系统的应用功能,装置配套了广泛的信息理解方式,整合形成辅助信息支持模块。该模块整合了相对较冷门的中医五运六气、干支计算等,疾病预判分支,以及情志问诊、健康问诊等信息分析方法,配套语音诊断,形成对预判准确度分析。

以干支计算原理为例,闻声诊系统的辅助信息支持模块的干支模块设计利用中医干支计时原理,将出生日期转化为干支因子,并利用中医对干支因子的诠释理解方法原理,对该因子进行升降、寒热、阴阳属性的归纳,得出样本基于干支特点的升降属性、阴阳平衡与寒热分布。得出五脏寒热因子。

其方法如下,在用户输入端,输入自己的生日信息10个数字,包括年份4个,月份2个,日期2个以及时间2个。通过中医干支计时方法,将时间转化为8个干支符号。利用中医对这些符号的内涵诠释,分解为寒热属性、阴阳属性、五音五行属性、出入属性以及升降属性。对这些属性的描述基于如图3.所示,量化计算方法如下:

升降属性中,升降力(fud)主要尝试对应个体气之升降,其字面含义表达干支属性中代表上升趋势的因子与下降趋势的因子,其综合效果的计算方式为:

n表示干支符号的总数,θi表示每一个序号对应的干支在图3中所处于的位置产生的θi角度。下同。

出入属性中,出入力(foi)主要尝试对应个体神识之开阖;其字面含义表达干支属性中具有离散属性的因子与聚合属性的因子,其综合效果的计算方式为:

寒热属性中,寒热力(fch)主要尝试对应个体寒热。其字面含义表达干支属性中具有热属性的因子与寒属性的因子,其总值量化计算方式为:

阴阳属性中,阴阳力(fyy)主要尝试对应个体整体功能亢进度以及神识的表达丰富度。表达干支属性中具有阳属性的因子与阴属性的因子,处于奇数位置的干支为阳性,处于偶数位置的干支属于阴性。其量化计算方式为:

其中,第一项为所有阳分量的寒热值求和(预设计),第二项为所有阴分量的寒热值求和。

将这部分属性作为样本的时间生日推导下的属性特征。

在大样本的数据计算过程中,通过比较该部分特征的差异,发现了不同的人,其语音中所表达的低频特性分布与上述三种计算结论均有一定的相关性。尽管不高,个体间数值差异较大,但是提示不同的时间出生的个体,在对应的语音信息中,可能存在有独特的影响方式。

利用该设计,可以支持相关的中医原理发现与规律探索。首先,在该特征支持下,结合中医理论,即可探索该个体的语音“体质”特征与出生时间的关系。本设计采用共振脆性这一物理概念名称表达语音的脏腑共振特性。参与共振越强的部位,能够得到的刺激就越多,表明其状态的好坏越能够得到感知与功能体现,其“阳”的属性推测就越高,如果发现语音次声对应的脏腑系统比例与干支计算得到的阴阳属性分配比例一致,且该一致性保持一定的高概率,则可等效认为样本的该脏腑为身体体用关系中的“用”。即具有多种物理属性的协同关系,该部分的偏性将会得到更加显著的表达。

该对应关系可通过进一步扩大数据外延得到量的扩充,通过结合其新陈代谢率,可以对应干支评估寒热,结合语音分析所对应的情志属性,即可表达其神之出入。对应干支神之出入属性的匹配。然而就次声分量而言,其参与语音发音过程的阳性的表达方式既能够利用中医理论推理出相应的脏腑特征,同样可以表达其对应关系。

闻声诊系统中的辅助信息支持模块,配套设计了优化的情志特征评估问卷。其设计方案参考目前权威的心理测评问卷,包括有92题目的mbti情志特征评估问卷,抑郁症问卷以及焦虑测评问卷等,对其中具有中医诊断价值的内容部分进行了提炼,并整合形成新的问卷评估体系。在问卷诠释过程中进行了去人格评价化设计,防止道德约束性回答,精炼其原有的重复性题目,并按照每一条题目对应的中医情志特征进行了重新总结,在输出原始的请个评价结论的同时,并配套有中医五行情志特征的诠释。最终形成优化的31项问题,可输出量化的五行情志属性,与语音样本输出的五行情志结论进行相关性比对,校准情志预判的精确度。

闻声诊系统的辅助信息支持模块纳入规范化中医问诊信息表述方法,建立了通过优化的30项中医问诊问卷题目,形成基于问诊的中医辩证自助式粗评。在该模块中,通过问诊可实现量化的五行辨证、八纲辨证、气血津液辨证问诊信息输出,问诊题目在设计中具有精确提问、量化回答、并记录每一道答题使用的时间、评估该回答的可靠性,得到样本的健康特征的八纲、气血津液以及五行结论,可比较判断语音分析得到的辩证结论的精确度。

5.中医综合辨识模块

中医综合辨识模块为分布式设计,实现了多种中医诊断理论,数据分析策略并行处理,并完成内部竞争,提升数据的准确性,通过融合语音样本与个人基本信息填入得到的转化数据,中医综合辨识模块可以拓展其信息整合功能,在独立的情志问诊与健康问诊数据数据结论支持下,实现对语音输出信息的识别精度、预判质量的准确性评估。

该模块有外部接口,可以在数据结构上直接纳入外部测量得到的嵌入式心电数据,并提取心电信号中的相关数据合并分析。合并分析的信号分析流程如下:语音经信息输入端,转化为原始的音频数字信号,在信号中提取1-20hz低频特征,获取心率数据以及心率变异系数,估算心率的变异范围,通过倍频效应,形成低频段的共振高危频段范围。然后评估语音在该频段的振动特征,幅值以及波动相关性,评价心脏共振参与度;同理,分析进一步利用脏腑共振特征。

心脏因其动态特性,难以实际测量其本征频率,但其本征共振频率通常认为与心脏的泵血节律之间有一定的关系。假定心率hr为70beat/min,其变异系数hrv计算中的sdnn指标,即24h心电全程记录中每5minr-r间期标准差(共288个值)的平均值为50ms,则表明心动范围大部分处于63.5-76.5beat/min之间。即频率为1.06-1.275hz之间,然后求取其二倍频率范围,并通过在权值上乘以预估系数μ,得出该频率对心脏原始本征频率的影响。本设计中μ=0.5t,t为倍频数,即对应的频率倍数越高,其对共振产生的直接影响越小,同时影响范围也越大。而在原始本征频率范围之内,其共振特性也随着与中心点的距离而呈平方级的减弱。形成脏腑受共振影响的综合效应估计。

当在语音中检测到该部分的频率时,可以认为是机体所有与心脏本征频率一致的器官的总和。在中医思维下,具有与心脏同等物理属性的结构,也能够在泵血中利用其自身的物理属性支持心脏的泵血功能,属于功能性心脏的一个组成部分,因此,我们在此命名为心脏主导的共振系统。等效为心脏共振对语音频率的支持。

人体在3-8hz频段存在垂直共振峰,对应于肝脏,脾脏等内部脏器。大部分内脏器官的固有频率在3-18hz,2hz左右时,身体可以被视作为一个整体。将上述方法拓展到各个脏腑器官,以各个脏腑基频共振频率值为基础,完成语音与各脏腑器官的共振频率响应度分析与分布。利用该模型设计得到的分类方法,设计计算方法,将一段语音中的次声分量通过该模式计算,分解为各个脏腑参与共振的强度。

当语音次声分量与某一脏腑关系较为密切的情况下,我们就可以等效认为语音对该脏腑的参与作用更大,语音表达过程对该脏腑的影响也就越大。该物理特征可以进一步基于中医闻声诊-闻脏腑功能理论的推导,表达相应的脏腑特性。而其所关联的内容,预判为情志相关。并设计的利用语音低频共振特点进行脏腑辨识,实现个体的五行脏腑偏性分析。当发现偏弱,低频共振幅度偏大的区间时,可以对该部分脏腑进行健康重点监护,并依据中医五行人理论推导其生理特征差异。

该外部整合能力为语音的脏腑辩证提供更丰富的信息整合来源,提升中医闻声诊诊断信息的全面性、稳定性,并通过嵌入移动终端实现个体化的健康监护服务。

6.结论输出:

闻声诊系统的数据结论输出分为两部分,第一部分结论输出为:基本物理属性特征,为语音的直接特征分量,作为后台数据分析的基础特征,可调用查看,但不作为前端显示;第二部分结论输出为中医辨证结果特征,数据显示为基于语音分析的五音-五行数据;发音部位-三焦辨证数据;次声-脏腑脆性数据;语调-脏腑辨证数据;并在权重整合之后得出最终的主要证候辨识结论。

7.使用方法

本专利设计的闻声诊系统有两种使用方法,分别是规范诊断方式与自由分析。前者按照指定的发音方法发音,完成数据采集分析、应用于基础音特征分析,获取无情态干扰下的基础稳态特征分析,包括客观的情志特征、性格基调、五行偏性、八纲、气血津液等证候相关健康状态;后者为在真实世界环境中,依据各种自然语境表达的任意形式的语音信号,用于评价暂态的情绪、主观证候特征;基于两种模式分别形成稳态与暂态特征结合,可以实时跟踪监护语音人的情志与健康状态。

另外,本专利开发的具有拓展性的主动干预使用方法,包括如下:

(1)低频反馈干预

发现其过低的语音次声分量,并采用主动的次声发射装置,将该部分频率进行放大后作为输出源,反馈人体,在该频率的共振干预作用下,提高相应脏腑谐振的时长与强度,在物理振动特性上提高脏腑响应率,最终实现基于次声低频的靶向性脏腑调理。

(2)语调训练

前期试验发现抑郁症等精神情志类患者较高的语音频率,提示降调语音训练有可能拮抗抑郁倾向。经验观察表明,语音交流过程中,相对个体基音而言,较高的音调(频率)往往代表着一种恭敬、奉上的感觉。当个体面对上级、长辈、老师或自己所倾慕的对象对话或汇报的过程中,往往采用以较高频调的声音,此时发音动力源上移,可能是胸式发音或喉式发音;而当面向下级、晚辈或学生的时候,语调偏向于向下、低沉,发音动力来源下移,趋向于腹式发音。抑郁症患者语音表达过程中偏高的语调,在情感上表达为一种自我贬抑,一种与对象无关的内在紧张与上承状态,既有可能是机体主观意志的习惯或者外部因素导致,也可以是由内在的情志异常所诱发。但是这样的语音音调同样也会反馈、强化抑郁心态。通过训练抑郁症患者或者抑郁高危倾向群体降调说话,可以在信息表达的过程中拮抗其升调奉上的习惯性语音状态,利用自身的语音发音表达过程的负反馈,平衡自身的情志偏性,改善抑郁状态。因此,借助语音分析,可在日常的语音过程中不断收到提示、训练自己的降调发音状态,或可减少抑郁发病的诱导因素。

系统将语音样本的主观特征与客观信息相结合,形成的双重信息支持的语音闻声诊结论,更提升中医闻声诊诊断的全面性、稳定性;在该模型所得出的结论的基础上,才能够形成食疗、养生方法、语音、声频、乐调式的即刻调理反馈,实现对健康的非药物即刻调理,频率干预,能量疏导。

对该闻声诊系统的应用方式总结可知,它不仅可以基于语音实现智能预判,而且提供了自我训练的评价工具,可以用与健康监护,在数据输出策略上,采用的是全面的参考数据输出方案,可满足用户对于即有知识的应用;这一特点使得该闻声诊系统也可以作为量化中医理论研究的工具,为研究者、科研工作者提供海量精确的数据来源,便于在未来试验中进一步发现更多的对应关系与规律性。在下面的具体实施方式案例中,列举几个应用场景,表达其使用功能。

附图说明

图1.整体信号分析流程

图中,1.人机接口信息录入界面,即语音信号输入端;2.语音自动识别vad模块,3.语音特征因子生成与分析模块,4.辅助信息支持模块,5.中医综合辨识模块。5步完成后得出辨证结论报告。

图2.语音-心电综合评估及中医辨证方案

其中,s1信号代表心电信号;s2代表语音信号。r-h表示得出的共振频率范围;r-vs表示语音次声段频率对应的幅值特征及其能量分布。tcm代表中医知识数据库,co表示结论,通过相关的诠释方法,即可得到心脏基于共振效果的辨证特性。当语音共振在心脏共振频率范围内达到一定的量,且超过其他脏腑时,可认为此人五行“用”火。如果其生日干支属性同样具有,则可判断为火行人。

图3.基于中医脏腑思维的五脏加三焦语音共振特征辨证

其中,li,h,s,lu,k,a分别代表中医认知下的肝系统、心系统。脾系统,肺系统以及肾系统,而整个腹腔躯干作为整体,视为三焦,共同参与中医五行模型。利用相关计算得到的各自的本征频率范围,结合语音中的频率分布,用于判断语音次声段分量在各个部位的分布特征。利用hmm模型,可分析得出最适脏腑,获取语音次声-脏腑对应关系。

图4.干支的升降、寒热、出入、阴阳量化模型

其中,θ角参与说明书正文中干支的升降、寒热、出入、阴阳量化模型计算。

具体实施方式

实施例1.抑郁症识别。

临床采集抑郁症样本(dp)30例、肾病样本(ud)30例,以及无临床确诊疾病的对照组样本(cm)60例。比较并统计组间语音样本中共计92项关键语音特征因子数据指标,发现:

ud组与dp组之间有7项指标具有极显著差异(***p<0.0001),10项指标具有显著差异(**p<0.001),22项指标具有显著差异性(*p<0.05)。差异率达到了42.39%,

ud组与cm组之间有9项指标具有极显著差异***(p<0.0001),6项指标具有显著差异**(p<0.001),11项指标具有显著差异性*(p<0.05),差异率达到了28.26%。

dp组与cm组之间有1项指标具有极显著差异***(p<0.0001),2项指标具有显著差异**(p<0.001),4项指标具有显著差异性*(p<0.05),差异率为7.6%。

数据表明该装置在对具有明显情志性症状的抑郁症方面具有多个可辨识指标,表明了其具有一定的辨病能力。

同时,指标得出的五行分类,脏腑辨证等趋势,与中医医师的诊断辨识发现的疾病特点相一致。

以三焦气机为例,可以发现数值统计如下表所示:

表1.组间三焦差异数值比较

注.(1)两两比较中,方差齐的分组采用lsd比较法,方差不齐的分组样本采用dummettt3比较法;(2)三焦数据基于原始数据计算数值,并未归一化,导致三焦数据均值与标准差存在组间异质性,组间数据之间没有可比性。

如上表所示,三焦气机中,中焦气机数据的组间差异性最高,dp组与ud组,dp组与cm间的差异均达到极其显著性差异(**p<0.000),表明抑郁症中焦气机明显低于肾病组与正常组,其余组间差异并不明显。抑郁症情志波动范围较常人更大,在中医理论中归纳为中气不足导致的升降失调。语音数据所表达数值特征与抑郁症证候特征具有一致性。

实施例2.情绪-脏腑脆性相关性实施方案

纳入ravdess数据库(ryersonaudio-visualdatabaseofemotionalspeechandsong)数据库样本;原始样本有24名演员,分别以01.中性(neutral),02.镇定(calm),03.开心(happy),04.忧伤(sad),05.愤怒(angry),06.害怕(fearful),07.厌恶(disgust),08惊讶(surprised)8种情绪录入同样语义的语音信息。按照该情绪分类进行分组,利用闻声诊系统分别提取其语音信号的相关特征,并将语音在1-20hz频段内的音频能量分为10等分累加,比较分析样本在表达不同情绪语音过程中,其在1-20hz间的次声数据达到最高值的样本占总样本数的比例值统计分布,得下表1所示数据:

表2.不同情绪组的语音样本次声峰值频率分布表

注.加粗字体表示样本语音次声频率峰值人数在全次声频率范围的峰值点,因18-20hz之后语音幅度大幅上升,因此仅观察18hz以内的语音数据。

而归纳人体生理学中各个脏腑的本征频率以及情志对应关系,如下表所示:

表3.中医五脏情志与情绪语音次声趋势间的关系

应用测试效果证明,该装置在语音次声频段分析中能够通过次声分量的幅值变化,识别不同情绪间的次声差异,且与保持中医脏腑共振保持一致。在证明了中医理论的有效性同时,得到相关的指标性数据及其测量方法。

实施例3.吸烟与不吸烟人群的差异性语音特征比较

比较大样本量的随意性语音,分析吸烟人群与不吸烟人群的语音特点,发现22项指标差异,分别如下表3所示:

表4.男性样本中,吸烟与不吸烟样本的语音特征差异统计表

根据上表数据分析显示,mel频谱中第4,12,20分段分别对应于345.5hz-492.0hz频段,2190.0hz-2571.1hz频段与7005.5hz-8000.0hz频段,该段的语音数据具有显著性组间差异。表现为不吸烟样本的该频段音量高于吸烟样本。相应的,在语音信号中的1-20hz次声频段音量参与整体语音音量数值比值关系上,发现吸烟的男性样本的次声频段音量幅值和高于非吸烟男性样本。

最末梢语调节律频率数据中非吸烟样本高于吸烟样本,表达了非吸烟样本的语音节奏变化范围更大,即语调更加丰满。在男性语音力度感指标中,吸烟样本高于不吸烟样本。这两项指标表达吸烟人群的语音“意识”更强,即更加兴奋,语调丰富,表明闻声诊系统可以测量出吸烟人群受烟草作用产生了一定的神经兴奋状态,并通过语音表达了出来。

mag一级极值数量标准差代表每一帧的傅里叶变换产生的频谱图中最基本的频率幅值波动极值数量,随着语音信号的帧移产生的数量上的变化量。该指标在不吸烟样本中的变化程度明显小于吸烟样本。mag一级极值数量简称为波纹,表达语音信号中频率分布的基本波动特征,其中最大的波动率表达了语音中的噪音数量最大的帧,其所对应的语音片段中的位置即最大波纹率位置,不吸烟样本的该位置更加靠前,接近中点,而吸烟样本则明显后移,表明噪音出现的位置在吸烟样本中更晚出现。

上实施例表明该闻声诊系统在指标设计上具有识别不同生活方式、习惯对语音发音系统的影响的能力,并通过量化表达其所产生的语音特征,间接分析其证候特点以及交感兴奋状态。

理解本发明的技术方案。但是,这些实施例仅仅是举例说明,不能认定本发明的具体实施方式仅限于这些实施例的说明。对本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和变换,都应当视为属于本发明的保护范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips