一种语音编解码系统和装置的制作方法

2021-01-28 16:01:56|

270|

起点商标网

本实用新型属于语音服务技术领域，涉及一种语音编解码系统和装置。

背景技术：

语音编码器的主要功能是把用户语音的pcm（脉冲编码调制）样值编码成少量的比特（帧）。语音编码器分为波形编码器、声码器和混合编码器。本实用新型的编码器采用声码器类型。语音解码为语音编码的逆过程，语音解码器将少量的比特（帧）解码成用户语音的pcm（脉冲编码调制）样值。

现有声码器从原始语音提取特征后将语音特征转换成不同音色的语音特征，而不是对特征进一步的简化，其通过声码器的编码部分得到的语音特征文件特征描述比较精细，语音特征文件能够较好地通过解码部分得到与原始语音文件相似的合成文件，但是，由于对于语音特征描述较为精细，使得语音特征存在较大冗余，而且大部分语音特征采用直接值进行表示，导致语音特征的数据量较大，处理速率较低；另外在其他应用领域，如语音识别、语音合成、语音通信中，由于语音特征要求不同，而现有语音编解码器只能提取单一的语音特征，并不能满足使用要求，适用范围较窄。

技术实现要素：

本实用新型的目的在于针对现有技术存在的问题，提供一种语音编解码系统和装置，有效解决了现有语音编解码器在提取语音特征中存在数据量大和提取语音特征单一的问题。

为此，本实用新型采取以下技术方案：

一种语音编解码系统，包括语音编码器和语音解码器，所述语音编码器包括语音采集模块、特征提取模块和特征降维模块，且语音采集模块、特征提取模块和特征降维模块依次电连接，所述语音解码器包括特征恢复模块、语音生成模块和语音播放模块，且特征恢复模块、语音生成模块和语音播放模块依次电连接，且所述特征降维模块与特征恢复模块电连接；

其中，所述语音采集模块用于采集原始语音信号并存储为原始语音文件，所述特征提取模块用于提取原始语音特征得到原始语音特征文件，所述特征降维模块用于对提取的原始语音特征进行降维和归一化处理，并得到特征降维文件；

所述特征恢复模块用于对特征降维文件升维和解归一化处理，并得到合成语音特征文件，所述语音生成模块用于对合成语音特征文件进行处理生成语音，并储存为合成语音文件，所述语音播放模块用于对合成语音文件进行播放。

一种语音编解码装置，应用如权利要求1所述的语音编解码系统，所述装置包括处理模块，所述处理模块分别与存储模块、语音处理模块、按键模块电连接；所述按键模块包括用于语音采集的录音按键、用于对语音文件进行特征提取和特征降维的编码按键、用于对特征降维文件进行特征恢复和语音生成的解码按键和用于语音播放的播放按键。

进一步地，所述处理模块采用s3c2440a处理器。

进一步地，所述语音处理模块采用wm8960芯片。

进一步地，所述存储模块包括sdram内存和nand-flash存储器。

进一步地，还包括显示器、麦克风和扬声器，所述显示器与处理模块电连接，所述麦克风和扬声器分别与语音处理模块电连接。

进一步地，所述处理模块用于控制语音处理模块进行语音采集和语音播放，并通过按键模块调取存储模块中的特征提取、特征降维、特征恢复、语音生成程序并执行程序，获得原始语音特征文件、特征降维文件、合成语音特征文件、合成语音文件并存储至存储模块。

本实用新型的有益效果在于：

本实用新型通过对原始语音文件提取语音特征，并对语音特征进行二次提取来降低语音特征中的冗余，并不改变原始语音的音色，而现有设备是对提取的语音特征进行音色变换，将一种音色语音的特征变换成另一种音色语音的特征；本实用新型对提取的语音特征进行二次提取，不仅能够降低语音特征中的冗余，而且采用不同的二次提取方法可以得到不同维度、参数等的语音特征，可以应用于语音合成、语音识别、语音通信等不同种场景中。

附图说明

图1为本实用新型的系统结构示意图；

图2为本实用新型的装置结构示意图。

图中，1-语音编码器，11-语音采集模块，12-特征提取模块，13-特征降维模块，2-语音解码器，21-特征恢复模块，22-语音生成模块，23-语音播放模块，3-语音编解码装置，31-处理模块，32-存储模块，33-语音处理模块，34-按键模块，341-录音按键，342-第一编码按键，343-第二编码按键，344-第一解码按键，345-第二解码按键，346-播放按键，35-显示器，36-麦克风，37-扬声器。

具体实施方式

本实用新型提供了一种语音编解码系统和装置，能够对原始特征二次提取，降低了特征中的冗余，同时可以适应不同的应用对于语音特征的要求，也能从得到的特征最终生成语音。

下面结合附图与实施方法对本申请的技术方案进行相关说明。

如图1所示，一种语音编解码系统，包括语音编码器1和语音解码器2；语音编码器1包括语音采集模块11、特征提取模块12和特征降维模块13；其中，语音采集模块11用于采集原始语音信号并存储为wav格式的语音文件，特征提取模块12用于提取原始语音特征得到原始语音特征文件，特征降维模块13用于对提取的原始语音特征进行降维和归一化处理，并得到特征降维文件。

语音解码器2包括特征恢复模块21、语音生成模块22和语音播放模块23；其中，特征恢复模块21用于对特征降维文件升维和解归一化处理，并得到合成语音特征文件，语音生成模块22用于对合成语音特征文件进行处理生成语音，并储存为wav格式的合成语音文件，语音播放模块23用于对合成语音文件进行播放。

如图2所示，一种语音编解码装置3，应用上述的语音编解码系统，包括处理模块31，处理模块31分别与存储模块32、语音处理模块33、按键模块34电连接，处理模块31用于控制语音处理模块33进行语音采集和语音播放，并通过按键模块34调取存储模块32中的特征提取模块12、特征降维模块13、特征恢复模块21、语音生成模块22所对应的特征提取、特征降维、特征恢复、语音生成程序并执行程序，获得原始语音特征文件、特征降维文件、合成语音特征文件、合成语音文件并存储至存储模块32。

具体地，处理模块31采用s3c2440a处理器，存储模块32包括sdram内存和nand-flash存储器，语音处理模块33采用wm8960芯片，按键模块34包括用于语音采集的录音按键341、用于对语音文件进行特征提取的第一编码按键342、用于对语音特征提取文件进行特征降维和归一化的第二编码按键343、用于对特征降维文件进行特征恢复和解归一化的第一解码按键344、用于对特征恢复文件进行语音生成的第二解码按键345和用于语音播放的播放按键346。

语音编解码装置3还包括显示器35、麦克风36和扬声器37，显示器35与处理模块31电连接，麦克风36和扬声器37分别与语音处理模块33电连接；其中，显示器35用于显示语音编解码过程中所涉及到的程序和文件，语音处理模块33用于对模拟语音信号进行模数转换（a/d转换）并存储为wav格式语音文件或者对wav格式语音文件中的数字语音信号进行数模转换（d/a转换）转换成模拟信号，麦克风36用于将语音引起的空气振动转化为模拟语音信号，扬声器37用于将模拟语音信号转化为空气振动进行输出。

本实用新型在编码过程中，首先按下录音按键341，语音采集模块11通过麦克风36和语音处理模块33采集原始语音信号并存储为wav格式语音文件；接着按下第一编码按键342，特征提取模块12对wav格式语音文件中的语音波形提取原始语音特征得到原始语音特征文件，其中，特征提取可以是语音波形提取，也可以对语音波形进行短时傅里叶变换从频域中提取，且提取的特征可以是基频特征、频谱包络特征、非周期特征以及是否静音、清音/浊音的判断；最后按下第二编码按键343，特征降维模块13对提取的原始特征进行特征降维和归一化处理，得到特征降维文件，其中，特征降维和归一化处理行为可以是在浊音段对基频取对数并归一化、对频谱包络抽取部分特征取对数并归一化、非周期抽取与基频相关的部分特征并归一化，静音、轻音段对不同的特征进行相应设置。

本实用新型在解码过程中，首先按下第一解码按键344，特征恢复模块21对特征降维后的特征进行升维和解归一化处理，得到合成语音特征文件，特征恢复是特征降维的逆过程，是对特征降维后的特征解归一化，通过进行平滑、插值等操作得到对应的基频特征、频谱包络特征、非周期特征以及静音、清音/浊音判断；接着按下第二解码按键345，语音生成模块22通过合成语音特征文件生成语音并储存为wav格式的合成语音文件；最后按下播放按键346，语音播放模块23通过扬声器37和语音处理模块33对wav格式语音文件进行播放。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。