编码装置、解码装置、编码方法、解码方法及程序与流程
本申请是申请日为2015年3月23日、申请号为201580003573.2、发明名称为“编码装置、解码装置、编码方法、解码方法及程序”的发明专利申请的分案申请。
本发明涉及将语音信号和音频信号(以下,设为语音信号等。)编码的装置、解码的装置。
背景技术:
将语音信号等以低比特率压缩的语音编码技术,是实现移动通信中的电波等的有效利用的重要技术。而且,近年来对通话语音的质量提高的期待不断高涨,一直期望实现现场感强的通话服务。为了实现这样的通话服务,将频带宽的语音信号等以高比特率编码即可。可是,该方法与电波和频带的有效利用矛盾。
作为将频带宽的信号以低比特率高质量地编码的方法,有将输入信号的频谱分割为低频部分和高频部分的2个频谱,通过高频频谱复制低频频谱并与其置换、即将高频频谱用低频频谱替代,使整体的比特率降低的技术(专利文献1)。该技术在低频频谱的编码上分配很多比特而高质量地编码,另一方面,将高频频谱复制编码后的低频频谱作为基本的处理,以较少的比特分配进行编码。
在直接采用专利文献1的技术的情况下,因低频频谱中出现的峰值性强的信号被直接复制到高频中,产生如钟声响起那样可听见的噪声,主观性的质量下降。因此,有将适当地调整了低频频谱的动态范围所得的频谱作为高频频谱的技术(专利文献2)。
现有技术文献
专利文献
专利文献1:特表2001-521648号公报
专利文献2:国际公开第2005/111568号
技术实现要素:
根据专利文献2的技术,动态范围考虑构成低频频谱的全体要素而确定。可是,语音信号等的频谱由峰值性较强的分量、即振幅较大的分量(音调分量)和峰值性较弱的分量、即振幅较小的分量(非音调分量)构成,根据专利文献2的技术,由于成为组合了两者的整体下的评价,所以未必可得到最好的结果。
本发明的一方式,通过使整体的比特率降低,并且将音调分量和非音调分量分离、独立而用于编码,提供能够编码、解码更加高质量的语音信号等的装置。
本发明的编码装置包括:第1编码单元,生成将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号、和将第1编码信号解码的低频解码信号;第2编码单元,基于低频解码信号,将比低频信号高频的信号编码而生成高频编码信号;以及第1复用单元,将第1编码信号和高频编码信号进行复用而输出编码信号,第2编码单元采用以下结构:计算高频信号的噪声分量即高频噪声分量和由低频解码信号生成的高频解码信号的高频非音调分量的能量比率,作为高频编码信号输出。
再有,这些概括性的并且具体的方式,可以通过系统、方法、集成电路、计算机程序、或记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意的组合来实现。
根据本发明的一方式的编码装置和解码装置,能够编码、解码更加高质量的语音信号等。
根据本发明的一个方面,提供了一种编码装置,包括:第1编码单元(102),对来自语音或音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号,以及对第1编码信号解码以生成低频解码信号;第2编码单元(106),基于低频解码信号,对频率高于低频信号的频率的、来自语音或音频输入信号的高频信号编码以生成高频编码信号;以及第1复用单元(103),将第1编码信号和高频编码信号进行复用以生成并输出编码信号,其中,该第2编码单元(106)计算作为高频信号的噪声分量的高频噪声分量和根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率,其中,该高频编码信号包括关于计算的能量比率的信息。
根据本发明的一个方面,提供了一种解码装置,该编码装置接收第1编码信号和高频编码信号,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码装置包括:分离单元(401),分离第1编码信号和高频编码信号;第1解码单元(402),对第1编码信号解码,以生成低频解码信号;以及第2解码单元(403),对高频编码信号解码,以通过使用低频解码信号生成宽带解码信号,其中,该高频编码信号包含关于作为噪声分量的高频噪声分量和从低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,其中,该第2解码单元(403)通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整从低频解码音频信号生成的高频解码音频信号的高频非音调分量的振幅。
根据本发明的一个方面,提供了一种解码装置,该编码装置接收第1编码信号、高频编码信号和频带能量编码信号,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码装置包括:第1解码单元(402),对该第1编码信号解码,以生成低频解码信号;第2解码单元(403),对该高频编码信号解码,以通过使用低频解码信号生成宽带解码信号;以及第3解码单元(501),对频带能量编码信号解码,以生成量化频带能量,其中,该第2解码单元包括:分离单元(503,603),从低频解码信号分离作为低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号;第1频带扩展单元(504),通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;第1缩放单元(505),通过使用对高频编码信号解码所得的比例因子来调整高频非音调信号的振幅;音调信号能量估计单元(510),根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;第1结合单元(506),将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;第2频带扩展单元(508),通过使用滞后信息,将低频音调信号复制为高频以生成高频音调信号;第2缩放单元(511),基于高频音调信号的能量,调整高频音调信号的振幅;第2结合单元(509),将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及加法运算单元(507),将宽带非音调信号和宽带音调信号进行加法运算以生成宽带解码信号,其中,该滞后信息是关于特定频带的位置信息,在该特定频带中高频信号和低频音调信号之间的相关性为最大,其中,该比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,该高频噪声分量为对应于滞后信息的高频信号的噪声分量。
根据本发明的一个方面,提供了一种终端装置,包括如上所述的编码装置。
根据本发明的一个方面,提供了一种终端装置,包括如上所述的解码装置。
根据本发明的一个方面,提供了一种编码方法,包括:对来自语音或音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号;对第1编码信号解码以生成低频解码信号;基于低频解码信号,对频率高于低频信号的频率的、来自语音或音频输入信号的高频信号编码以生成高频编码信号;计算作为高频信号的噪声分量的高频噪声分量和根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率;将第1编码信号和高频编码信号进行复用以生成并输出编码信号,该高频编码信号包括关于计算的能量比率的信息。
根据本发明的一个方面,提供了一种用于第1编码信号和高频编码信号的解码方法,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码方法包括:分离第1编码信号和高频编码信号,对第1编码信号进行解码,以生成低频解码信号;以及对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号,其中,该高频编码信号包含关于作为噪声分量的高频噪声分量和从低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整从低频解码音频信号生成的高频解码音频信号的高频非音调分量的振幅。
根据本发明的一个方面,提供了一种用于第1编码信号、高频编码信号和频带能量编码信号的解码方法,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码方法包括:对第1编码信号进行解码,以生成低频解码信号;对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号;对频带能量编码信号进行解码,以生成量化频带能量;从低频解码信号分离作为低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号;通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;通过使用对高频编码信号解码所得的比例因子,调整高频非音调信号的振幅;根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;通过使用滞后信息,将该低频音调信号复制为高频以生成高频音调信号;基于高频音调信号的能量,调整高频音调信号的振幅;将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及将宽带非音调信号和宽带音调信号进行加法运算以生成宽带解码信号,其中,该滞后信息是关于特定频带的位置信息,在该特定频带中高频信号和低频音调信号之间的相关性为最大,其中,该比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,该高频噪声分量为对应于滞后信息的高频信号的噪声分量。
根据本发明的一个方面,提供了一种程序,使处理器执行如上所述的编码方法。
根据本发明的一个方面,提供了一种程序,使处理器执行如上所述的解码方法。
附图说明
图1是本发明的编码装置的整体结构图。
图2是本发明的实施方式1中的编码装置的第2层编码单元的结构图。
图3是本发明的实施方式2中的编码装置的第2层编码单元的结构图。
图4是本发明的实施方式中的另一编码装置的整体结构图。
图5是本发明的解码装置的整体结构图。
图6是本发明的实施方式3中的解码装置的第2层解码单元的结构图。
图7是本发明的实施方式4中的解码装置的第2层解码单元的结构图。
图8是本发明的实施方式中的另一解码装置的整体结构图。
图9是本发明的实施方式中的另一编码装置的整体结构图。
图10是本发明的实施方式中的另一解码装置的整体结构图。
具体实施方式
以下,参照附图说明本发明的实施方式的结构和动作。再有,本发明的对编码装置输入的输入信号、和从解码装置输出的输出信号,除了仅指狭义的语音信号的情况,还包含频带更宽的音频信号的情况,而且,也包含这些信号混合的情况。
(实施方式1)
图1是表示实施方式1的语音信号等的编码装置的结构的框图。这里,作为例子说明编码信号具有多个层组成的层结构的情况,即进行分层编码(可扩展编码)的情况。作为包含分层编码以外的例子,在后述的图4中说明。图1所示的编码装置100由下采样单元101、第1层编码单元102、复用单元103、第1层解码单元104、延迟单元105、第2层编码单元106构成。此外,在复用单元103中连接着未图示的天线。
下采样单元101从输入信号生成采样率低的信号,作为规定的频率以下的低频信号输出到第1层编码单元102。
第1层编码单元102是构成第1编码单元的要素的一方式,将低频信号编码。作为编码的例子,可列举celp编码和变换编码。编码的低频信号,作为用作第1编码信号的低频编码信号被输出到第1层解码单元104和复用单元103。
第1层解码单元104是共同构成第1编码单元的要素的一方式,将低频编码信号解码,生成低频解码信号。然后,第1层解码单元104将低频解码信号s1输出到第2层编码单元106。
另一方面,延迟单元105使输入信号延迟规定的时间。该延迟时间用于校正在下采样单元101、第1层编码单元102、和第1层解码单元104中产生的时间延迟。延迟单元105将延迟的输入信号s2输出到第2层编码单元106。
第2层编码单元106是第2编码单元的一方式,基于由第1层解码单元104生成的低频解码信号s1,将输入信号s2之中规定的频率以上的高频信号编码而生成高频编码信号。第2层编码单元中输入的低频解码信号s1、输入信号s2被施加mdct等的变频后输入。然后,第2层编码单元106将高频编码信号输出到复用单元103。第2层编码单元106的细节,将后述。
复用单元103将低频编码信号和高频编码信号进行复用而生成编码信号,将它通过未图示的天线发送到解码装置。
图2是表示本实施方式中的第2层编码单元106的结构的框图。第2层编码单元106由噪声加法运算单元201、分离单元202、频带扩展单元203、噪声分量能量计算单元204(第1计算单元)、增益计算单元205(第2计算单元)、能量计算单元206、复用单元207、频带扩展单元208构成。
噪声加法运算单元201对从第1层解码单元104输入的低频解码信号s1,相加噪声信号。再有,噪声信号是指具有随机的性质的信号,例如是信号强度的振幅相对时间轴或频率轴不规则地上下变动的信号。噪声信号的生成,可以每次基于随机数生成,也可以将预先生成的噪声信号(例如,白噪声、高斯噪声、粉红噪声等)保存在存储器等的存储装置中,调用该噪声信号并输出。此外,噪声信号不限于一个,也可以根据规定的条件,从多个噪声信号之中选择一个并输出。
将输入信号编码时,若可分配的比特数少,则仅有小部分的频率分量能量化,有主观质量劣化的问题,但通过在噪声加法运算单元201中相加噪声,将未被量化就为零的分量用噪声信号填充,能够期待缓和劣化的效果。
再有,噪声加法运算单元201是任意的结构。然后,噪声加法运算单元201将相加了噪声信号的低频解码信号输出到分离单元202。
分离单元202将相加了噪声信号的低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。这里,音调分量是指振幅比规定的阈值大的分量、或用脉冲量化器量化过的分量。此外,非音调分量是指具有规定的阈值以下的振幅的分量、或未用脉冲量化器量化而为零的分量。
在使用规定的阈值区分音调分量和非音调分量的情况下,对于构成低频解码信号的分量,以振幅是否比规定的阈值大来分离。在以是否用脉冲量化器进行了量化来区分音调分量和非音调分量的情况下,由于相当于规定的阈值为零的情况,所以通过从噪声加法运算单元201中相加了噪声的低频解码信号中减去低频解码信号s1,能够生成低频音调信号。
然后,分离单元202将低频非音调信号输出到频带扩展单元203,将低频音调信号输出到频带扩展单元208。
频带扩展单元208将输入信号s2的高频信号作为目标,搜索使用于频带扩展所生成的低频音调信号之间的相关为最大的低频音调信号的特定的频带。搜索也可以通过从预先准备的特定的候选位置之中选择使所述相关最大的候选来进行。用于频带扩展所生成的低频音调信号,可以直接使用由分离单元202分离出的(量化过的)低频音调信号,也可以使用进行了平滑或归一化的音调信号。
然后,频带扩展单元208将表示搜索出的特定的频带的位置的信息、即确定用于扩展频带的生成的低频频谱的位置(频率)的信息、也就是滞后信息输出到复用单元207和频带扩展单元203。再有,滞后信息不必与所有的扩展频带对应的滞后信息齐备,也可以仅传送与一部分扩展频带对应的滞后信息。例如,也可以对于通过频带扩展而生成的子带之中的一部分,将滞后信息编码,剩余的部分不编码,将在解码装置侧使用滞后信息生成的频谱折叠地生成。
此外,频带扩展单元208通过从输入信号s2的高频信号之中选择振幅大的信号,仅使用该选择出的分量进行所述相关的计算,削减相关运算的计算量,同时将选择的分量的频率位置信息作为高频音调分量频率位置信息输出到噪声分量能量计算单元204(第1计算单元)。
频带扩展单元203以用滞后信息确定的特定的频带的位置为基准,截取低频非音调信号作为高频非音调信号,将该高频非音调信号输出到增益计算单元205。
噪声分量能量计算单元204使用高频音调分量频率位置信息,计算输入信号s2的高频信号的噪声分量即高频噪声分量的能量,输出到增益计算单元205。具体地说,通过从输入信号s2的高频部分整体的能量中减去高频部分之中高频音调分量频率位置的分量的能量,求不是高频音调分量的分量能量,将它作为高频噪声分量能量输出到增益计算单元205。
增益计算单元205计算从频带扩展单元203输出的高频非音调信号的能量,计算该能量和从噪声分量能量计算单元204输出的高频噪声分量的能量之间的比率,将它作为比例因子输出到复用单元207。
能量计算单元206计算输入信号s2的每个子带的能量。例如,能够计算将输入信号s2分割为子带的情况下的、子带内的频谱的平方和。例如,能够按下式定义。
其中,x是mdct系数,b是子带的号,epsilon是用于标量量化的常数。
然后,能量计算单元206将表示求得的量化频带能量的大小的指标作为量化频带能量输出到复用单元207。
复用单元207将滞后信息、比例因子和量化频带能量编码,将它进行复用。然后,将通过复用得到的信号作为高频编码信号输出。再有,复用单元207和复用单元103可以单独地设置,也可以作为一体设置。
这样,在本实施方式中,在增益计算单元205(第2计算单元)中,求输入信号的高频信号之中的高频非音调(噪声)分量的能量和由低频解码信号生成的高频解码信号之中的高频非音调(噪声)信号的能量的比率,所以具有能够更准确地再现解码信号中的非音调(噪声)分量的能量的效果。
即,能够更准确地再现比音调分量小、容易出现误差的非音调分量的能量,解码信号中的非音调分量的能量稳定。此外,使用频带能量和非音调分量的能量计算的音调分量的能量也能够更准确地再现。然后,能够以较少的比特数编码高频编码信号。
(实施方式2)
接着,使用图3说明本发明的实施方式2中的编码装置的结构。再有,与实施方式1同样,本实施方式中的编码装置100整体的结构具有图1的结构。
图3是表示本实施方式中的第2层编码单元106的结构的框图。与实施方式1的第2层编码单元106的不同在于,噪声加法运算单元和分离单元的位置关系相反,并具有分离单元302、噪声加法运算单元301。
分离单元302将低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。与实施方式1中说明的同样,分离方法将规定的阈值为基准,按振幅的大小进行分离。也可以将阈值设定为零。
噪声加法运算单元301对从分离单元302输出的低频非音调信号,相加噪声信号。为了对已经具有振幅的分量不相加噪声信号,也可以参照低频解码信号s1。
再有,对实施方式1、2说明了使用分层编码的例子,但实施方式1、2也能够适用于采用了分层编码以外的情况。图4和图9是其另一编码装置110、610的例子。首先说明图4的编码装置110。
图4所示的编码装置110由时间-变频单元111、第1编码单元112、复用单元113、频带能量归一化单元114、第2编码单元115构成。
时间-变频单元111对输入信号使用mdct等进行变频。
频带能量归一化单元114对施加了变频的输入信号即输入频谱,对每个规定的频带进行频带能量的计算、量化和编码,将频带能量编码信号输出到复用单元113。此外,频带能量归一化单元114使用量化的频带能量,计算对第1编码单元和第2编码单元分配的比特分配信息b1和b2,分别输出到第1编码单元112和第2编码单元115。此外,频带能量归一化单元114进而以量化的频带能量进行各频带的输入频谱的归一化,将归一化输入频谱s2输出到第1编码单元112和第2编码单元115。
第1编码单元112基于输入的比特分配信息b1,对包含规定的频率以下的低频信号的归一化输入频谱s2,进行第1编码。然后,第1编码单元112将编码的结果生成的第1编码信号输出到复用单元113。此外,第1编码单元112将编码的过程中得到的低频解码信号s1输出到第2编码单元115。
第2编码单元115对归一化输入频谱s2之中第1编码单元112无法编码的每个部分,进行第2编码。第2编码单元115可采用图2、图3中说明的第2层编码单元106的结构。
接着,说明图9的编码装置610。图9所示的编码装置610由时间-变频单元611、第1编码单元612、复用单元613、第2编码单元614构成。
时间-变频单元611对输入信号使用mdct等进行变频。
第1编码单元612对施加了频率变化的输入信号即输入频谱,对每个规定的频带进行频带能量的计算和量化,将频带能量编码信号输出到复用单元613。此外,第1编码单元612使用量化的频带能量,计算对第1编码信号和第2编码信号分配的比特分配信息,基于比特分配信息,对包含规定的频率以下的低频信号的归一化输入频谱s2,进行第1编码。然后,第1编码单元612将第1编码信号输出到复用单元613,同时将第1编码信号的解码信号之中的、低频分量即低频解码信号输出到第2编码单元614。这里,也可以对于将输入信号以量化频带能量进行了归一化的信号进行第1编码。该情况下,第1编码信号的解码信号为以量化频带能量进行了解归一化的信号。此外,第1编码单元612将分配给第2编码信号的比特分配信息和高频的量化频带能量信息输出到第2编码单元614。
第2编码单元614对输入频谱s2之中第1编码单元612无法编码的每个部分,进行第2编码。第2编码单元614可采用在图2、3中说明的第2层编码单元106的结构。再有,在图2、图3中没有明确记载,但比特分配信息被输入到将滞后信息编码的频带扩展单元208、和将比例因子编码的增益计算单元。此外,在图2、图3中,示出了使用输入信号计算频带能量并进行量化的能量计算单元206,而在图9中,由于在第1编码单元612中进行该处理,所以不是必要的。
(实施方式3)
图5是表示实施方式3的语音信号解码装置的结构的框图。这里,编码信号是从具有多个层组成的层结构的编码装置发送的信号,作为例子说明将该编码信号解码的解码装置。再有,对于没有层结构的例子,用图8说明。
图5所示的解码装置400由分离单元401、第1层解码单元402、第2层解码单元403构成。此外,在分离单元401上,连接着未图示的天线。
分离单元401将通过未图示的天线输入的编码信号分离为用于第1编码信号的低频编码信号和高频编码信号。分离单元401将低频编码信号输出到第1层解码单元402,将高频编码信号输出到第2层解码单元403。
第1层解码单元402是第1解码单元的一方式,将低频编码信号解码,生成低频解码信号s1。作为第1层解码单元402的解码的例子,可列举celp解码。第1层解码单元402将低频解码信号输出到第2层解码单元403。
第2层解码单元403是第2解码单元的一方式,将高频编码信号解码,使用低频解码信号生成宽带解码信号并输出。第2层解码单元403的细节,将后述。
然后,低频解码信号、和/或宽带解码信号通过未图示的放大器和扬声器被再生。
图6是表示本实施方式中的第2层解码单元403的结构的框图。第2层解码单元403由解码和分离单元501、噪声加法运算单元502、分离单元503、频带扩展单元504、缩放单元505、结合单元506、加法运算单元507、频带扩展单元508、结合单元509、音调信号能量估计单元510、缩放单元511构成。
解码和分离单元501将高频编码信号解码,分离为量化频带能量a、比例因子b、和滞后信息c。再有,分离单元401与解码和分离单元501可以单独地设置,也可以作为一体设置。
噪声加法运算单元502对从第1层解码单元402输入的低频解码信号s1相加噪声信号。噪声信号使用与编码装置100的噪声加法运算单元201中相加的噪声信号相同的噪声信号。然后,噪声加法运算单元502将相加了噪声信号的低频解码信号输出到分离单元503。
分离单元503从相加了噪声信号的低频解码信号中,分离非音调分量和音调分量,分别作为低频非音调信号和低频音调信号输出。分离为低频非音调信号和低频音调信号的方法,与编码装置100的分离单元202中说明的方法是同样的。
频带扩展单元504使用滞后信息c,将特定的频带的低频非音调信号复制为高频而生成高频非音调信号。
缩放单元505通过对频带扩展单元504中生成的高频非音调信号乘以比例因子b,调整高频非音调信号的振幅。
然后,在结合单元506中,将低频非音调信号和由缩放单元505调整了振幅的高频非音调信号相结合,生成宽带非音调信号。
另一方面,分离单元503中分离出的低频音调信号被输入到频带扩展单元508。然后,与频带扩展单元504相同,频带扩展单元508使用滞后信息c,将特定的频带的低频音调信号复制为高频而生成高频音调信号。
音调信号能量估计单元510计算调整了从缩放单元505输入的振幅的高频非音调信号的能量,同时将从量化频带能量a的值减去高频非音调信号的能量来求高频音调信号的能量。然后,将高频非音调信号的能量和高频音调信号的能量之比输出到缩放单元511。
缩放单元511通过将高频音调信号乘以高频非音调信号的能量和高频音调信号的能量之比,调整高频音调信号的振幅。
然后,由结合单元509将低频音调信号和调整了振幅的高频音调信号相结合,生成宽带音调信号。
最后,由加法运算单元507将宽带非音调信号和宽带音调信号相加,生成、输出宽带解码信号。
这样,在本实施方式中,具有使用低频量化频谱,以较少的比特生成非音调分量,以比例因子调整以具有适当的能量,使用该调整过的非音调分量的能量,调整高频音调信号的能量的结构,所以用较少的信息量编码、传输、解码音乐信号等,能够适当地再现高频的非音调分量的能量。此外,通过使用量化频带能量信息和非音调分量的能量信息来确定音调分量的能量,合适的音调分量的能量也能够再现。
(实施方式4)
接着,使用图7说明本发明的实施方式4中的解码装置的结构。再有,与实施方式1同样,本实施方式中的解码装置400整体的结构具有图4的结构。
图7是表示本实施方式中的第2层解码单元403的结构的框图。与实施方式1和实施方式2之间的关系同样,与实施方式3的第2层解码单元403的不同在于,噪声加法运算单元和分离单元的位置关系相反,具有分离单元603、噪声加法运算单元602。再有,在图7中,解码和分离单元501省略记载。
分离单元603将低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。
噪声加法运算单元602对于从分离单元603输出的低频非音调信号,相加噪声信号。
再有,对于实施方式3、4说明了使用分层编码的例子,但实施方式3、4也能够适用于采用了分层编码以外的情况。图8和图10是其另一解码装置410、620的例子。首先,说明图8所示的解码装置410。
图8所示的解码装置410由分离单元411、第1解码单元412、第2解码单元413、频率-时间转换单元414、频带能量解归一化单元415、合成单元116构成。
分离单元411将通过未图示的天线输入的编码信号分离为第1编码信号、高频编码信号和频带能量编码信号。分离单元411将第1编码信号输出到第1解码单元412,将高频编码信号输出到第2解码单元413,将频带能量编码信号输出到频带能量解归一化单元415。
频带能量解量化单元415将频带能量编码信号解码,生成量化频带能量。频带能量解量化单元415基于量化频带能量,计算对第1解码单元和第2解码单元的比特分配信息b1和b2,并分别输出。此外,频带能量解量化单元415将生成的量化频带能量乘以从合成单元416输入的归一化宽带解码信号,进行解归一化,生成最终的宽带解码信号,输出到频率-时间转换单元414。
第1解码单元412根据比特分配信息b1,将第1编码信号解码,生成低频解码信号s1和高频解码信号。第1解码单元412将低频解码信号输出到第2解码单元413,将高频解码信号输出到合成单元416。
第2解码单元413根据比特分配信息b2,将高频编码信号解码,使用低频解码信号生成宽带解码信号并输出。第2解码单元413可采用与图6、图7中说明的第2层解码单元403相同的结构。
合成单元416将由第1解码单元解码的高频解码信号加入到从第2解码单元输入的宽带解码信号中,生成归一化宽带解码信号,输出到频带能量解归一化单元415。
然后,从频带能量解归一化单元415输出的宽带解码信号由频率-时间转换单元414转换为时域的信号,通过未图示的放大器和扬声器被再生。
接着,说明图10所示的解码装置620。图10是其另一解码装置620的例子。图10所示的解码装置620由第1解码单元621、第2解码单元622、合成单元623,频率-时间转换单元624构成。
第1解码单元621输入通过未图示的天线输入的编码信号(包含第1编码信号、高频编码信号和频带能量编码信号),首先将频带能量分离、解码。将解码的频带能量的高频部分作为高频频带能量(a)输出到第2解码单元622。接着,第1解码单元621基于解码的频带能量计算比特分配信息,将第1编码信号分离、解码。该解码处理也可以包含采用了所述解码的频带能量的解归一化处理。将解码的第1解码信号的低频部分作为低频解码信号输出到第2解码单元621。接着,第1解码单元621基于所述比特分配信息,将高频编码信号分离、解码。解码的高频解码信号包含比例因子(b)和滞后信息(c),将它们输出到第2解码单元622。此外,第1解码单元621将所述第1解码信号的高频部分作为高频解码信号输出到合成单元623。也有高频解码信号为零的情况。
第2解码单元622使用从第1解码单元621输入的、低频解码信号、解码的量化频带能量、比例因子、滞后信息生成宽带解码信号并输出。第2解码单元622也可以采用与图6、图7中说明的第2层解码单元403相同的结构。
合成单元623将由第1解码单元621解码的高频解码信号加入到从第2解码单元622输入的宽带解码信号中,生成宽带解码信号,由频率-时间转换单元624转换为时域的信号,通过未图示的放大器和扬声器被再生。
根据本公开的一方面,提供了编码装置,包括:第1编码单元,将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号,将所述第1编码信号解码而生成低频解码信号;第2编码单元,基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号;以及第1复用单元,将所述第1编码信号和所述高频编码信号进行复用而输出编码信号,所述第2编码单元计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,作为高频编码信号输出。
根据本公开的一方面,上述编码装置还包括:能量计算单元,计算所述语音或音频输入信号的能量并作为量化频带能量输出,所述第1复用单元将所述量化频带能量、所述第1编码信号和所述高频编码信号复用并输出。
根据本公开的一方面,所述第2编码单元包括:分离单元,将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;第1频带扩展单元,将使所述高频信号和所述低频音调信号之间的相关为最大的特定的频带的位置信息作为滞后信息输出;第2频带扩展单元,将与所述滞后信息对应的所述低频非音调信号作为高频非音调信号输出;第1计算单元,从与所述滞后信息对应的所述高频信号,计算噪声分量即高频噪声分量的能量;第2计算单元,从所述高频噪声分量和所述高频非音调信号的能量比率计算所述比率,作为比例因子输出;以及第2复用单元,将所述滞后信息和所述比例因子进行复用并作为高频编码信号输出。
根据本公开的一方面,所述第2编码单元还包括噪声加法运算单元,在所述低频解码信号中相加噪声信号。
根据本公开的一方面,所述第2编码单元还包括:噪声加法运算单元,在所述分离单元输出的所述低频非音调信号中相加噪声信号。
根据本公开的另一方面,提供了解码装置,其是被输入了在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号的解码装置,包括:分离单元,分离为所述第1编码信号和所述高频编码信号;第1解码单元,将所述第1编码信号解码而生成低频解码信号;以及第2解码单元,将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号,所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,所述第2解码单元参照解码的所述比率,调整所述低频解码信号的非音调分量即低频非音调信号的振幅。
根据本公开的另一方面,提供了解码装置,其是被输入了在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、将比所述低频信号高频的信号编码所得的高频编码信号、以及频带能量编码信号的解码装置,包括:第1解码单元,将所述第1编码信号解码而生成低频解码信号;第2解码单元,将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号;以及第3解码单元,将所述频带能量编码信号解码而生成量化频带能量,所述第2解码单元包括:分离单元,将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;第1频带扩展单元,使用将所述高频编码信号解码所得的滞后信息,将所述低频非音调信号复制为高频而生成高频非音调信号;第1缩放单元,使用将所述高频编码信号解码所得的比例因子来调整所述高频非音调信号的振幅;音调信号能量估计单元,从所述高频非音调信号的能量和所述量化频带能量,估计高频音调信号的能量;第1结合单元,将所述低频非音调信号和所述高频非音调信号相结合而生成宽带非音调信号;第2频带扩展单元,使用所述滞后信息,将所述低频音调信号复制为高频而生成高频音调信号;第2缩放单元,基于所述高频音调信号的能量,调整所述高频音调信号的振幅;第2结合单元,将所述低频音调信号和调整了振幅的所述高频音调信号相结合而生成宽带音调信号;以及加法运算单元,将所述宽带非音调信号和所述宽带音调信号进行加法运算而生成宽带解码信号,所述滞后信息是使高频信号和低频音调信号之间的相关为最大的特定的频带的位置信息,所述比例因子是对应于所述滞后信息的高频信号的噪声分量即高频噪声分量和高频非音调信号的能量比率。
根据本公开的另一方面,其中,所述第2解码单元还包括:噪声加法运算单元,在所述低频解码信号中相加噪声信号。
根据本公开的另一方面,其中,所述第2解码单元还包括:噪声加法运算单元,在从所述分离单元输出的所述低频非音调信号中相加噪声信号。
根据本公开的又一方面,提供了终端装置,具有上述的编码装置。
根据本公开的又一方面,提供了终端装置,具有上述的解码装置。
根据本公开的又一方面,提供了编码方法,包括以下步骤:将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号;将所述第1编码信号解码而生成低频解码信号;基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号;计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率;将所述第1编码信号和包含所述比率的高频编码信号进行复用并输出编码信号。
根据本公开的一方面,上述解码方法还包括:计算所述语音或音频输入信号的能量并作为量化频带能量输出;将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;将使所述高频信号和所述低频音调信号之间的相关为最大的特定的频带的位置信息作为滞后信息输出;将与所述滞后信息对应的所述低频非音调信号作为高频非音调信号输出;从与所述滞后信息对应的所述高频信号,计算噪声分量即高频噪声分量的能量;计算所述高频噪声分量和所述高频非音调信号的能量比率并作为比例因子输出。
根据本公开的又一方面,提供了解码方法,包括以下步骤:对于在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号,分离为所述第1编码信号和所述高频编码信号,将所述第1编码信号进行解码而生成低频解码信号;以及将所述高频编码信号进行解码,使用所述低频解码信号生成宽带解码信号,所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,生成解码的所述比率,参照所述比率,调整所述低频解码信号的非音调分量即低频非音调信号的振幅。
根据本公开的又一方面,提供了解码方法,包括以下步骤:对于在编码装置中将语音或音频输入信号的规定频率以下的低频信号进行了编码的第1编码信号、将比所述低频信号高频的信号进行了编码的高频编码信号、以及频带能量编码信号,将所述第1编码信号解码而生成低频解码信号;将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号;将所述频带能量编码信号解码而生成量化频带能量;将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;使用将所述高频编码信号解码所得的滞后信息,将所述低频非音调信号复制为高频而生成高频非音调信号;使用将所述高频编码信号解码所得的比例因子,调整所述高频非音调信号的振幅;从所述高频非音调信号的能量和所述量化频带能量,估计高频音调信号的能量;将所述低频非音调信号和所述高频非音调信号相结合而生成宽带非音调信号;使用所述滞后信息,将所述低频音调信号复制为高频而生成高频音调信号;基于所述高频音调信号的能量,调整所述高频音调信号的振幅;将所述低频音调信号和调整了振幅的所述高频音调信号相结合而生成宽带音调信号;以及将所述宽带非音调信号和所述宽带音调信号进行加法运算而生成宽带解码信号,所述滞后信息是使高频信号和低频音调信号之间的相关为最大的特定的频带的位置信息,所述比例因子是对应于所述滞后信息的高频信号的噪声分量即高频噪声分量和高频非音调信号的能量比率。
根据本公开的又一方面,提供了程序,使处理器执行以下处理:将语音或音频的输入信号的规定频率以下的低频信号编码而生成第1编码信号的处理;将所述第1编码信号解码而生成低频解码信号的处理;基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号的处理;计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率的处理;以及将所述第1编码信号和包含所述比率的高频编码信号进行复用并输出编码信号的处理。
根据本公开的又一方面,提供了程序,使处理器执行以下处理:对于在编码装置中将语音或音频的输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号,分离为所述第1编码信号和所述高频编码信号的处理;将所述第1编码信号解码而生成低频解码信号的处理;将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号的处理;所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,生成解码的所述比率,参照所述比率来调整所述低频解码信号的非音调分量即低频非音调信号的振幅的处理。
(总结)
以上,用实施方式1到4说明了本发明的编码装置和解码装置。本发明的编码装置和解码装置既可以是主板和半导体元件为代表的半成品和部件级别的形式,也可以是包含终端装置和基站装置的完成品级别的形式的概念。在本发明的解码装置和编码装置为半成品和部件级别的形式的情况下,通过与天线、da/ad转换器、放大器、扬声器、和话筒等组合成为完成品级别的形式。
再有,从图1到图10的框图表示专用地设计的硬件的结构和动作(方法),同时也包含通过在通用的硬件中安装执行本发明的动作(方法)的程序,由处理器执行来实现的情况。作为通用的硬件的电子计算机,例如可列举个人计算机、智能手机等的各种移动信息终端、和移动电话等。
此外,专用地设计的硬件不限于移动电话和固定电话等的完成品级别(消费电子),也包含主板和半导体元件等半成品和部件级别。
再有,作为在基站中使用本发明的情况的例子,可列举在基站中进行变更语音编码方式的编码转换的情况。再有,基站是包含在通信线路的中途存在的各种节点的概念。
工业实用性
本发明的编码装置和解码装置可应用于与语音信号和音频信号的纪录、传输、再生有关的设备。
标号说明
100,110,610编码装置
101下采样单元
102第1层编码单元
103,113,613复用单元
104第1层解码单元
105延迟单元
106第2层编码单元
201,301噪声加法运算单元
202,302分离单元
203频带扩展单元
204噪声分量能量计算单元(第1计算单元)
205增益计算单元(第2计算单元)
206能量计算单元
207复用单元
208频带扩展单元
400,410,620解码装置
401,411分离单元
402第1层解码单元
403第2层解码单元
501解码和分离单元
502,602噪声加法运算单元
503,603分离单元
504频带扩展单元
505缩放单元
506结合单元
507加法运算单元
508频带扩展单元
509结合单元
510音调信号能量估计单元
511缩放单元(scalingunit)
112,612第1编码单元
115,614第2编码单元
412,621第1解码单元
413,622第2解码单元
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除