语音信号处理方法的可靠性研究*
梁晓辉1,周
权
1,2
(1.西北工业大学,陕西西安710072;2.赫尔辛基工业大学,芬兰埃斯波02015)
【摘
要】理论分析了信号处理的全过程,描述了各个步骤之间的数学关系,得到信号可靠处理需满足的条件。提
出了过采样方法,可提高信号的抗混叠性能;选用合适的窗函数,可减小信号谱间干扰与展宽;提出了补零法和重新采样法,可提高谱线频域分辨率。另外,通过语音信号处理试验,验证了所提出的方法可提高信号的抗混叠性能、抗谱间干扰与展宽性能,提高了频域分辨率。
【关键词】语音信号处理;可靠性;过采样;重采样;抗混叠【中图分类号】TN912
【文献标识码】B
Validity Research of Acoustic Signal Processing
LIANG Xiao-hui 1,ZHOU Quan 1,2
(1.Northwestern Polytechnical University ,Xi ′an 710072,China ;
2.Helsinki University of Technology ,Espoo 02015,Finland )
【Abstract 】During modem signal sampling and processing ,validity sampling ,processing and analyzing signals are the
premises of correctly using signals.The whole processing of signal processing ,including pre-filter ,sampling ,AD transfer ,frequency-analysis and frequency domain processing ,DA transform etc ,are analyzed ,and the detail the mathematic relationships between all steps are described.
Further more ,
the requirements for validity processing are achieved.
Meanwhile ,the over-sample method is proposed ,which improves the anti-aliasing character.The cut signal processing by selecting proper window function is analyzed ,which can deduce spectrum interference and widen.The methods of adding zeros and re-sampling is presented ,which can increase the spectrum resolution.Additionally ,the acoustic signal process experiments verify that the released method can increase the anti-aliasing character ,improve the anti spectrum inference and widen ,and improve the spectrum domain resolution.
【Key words 】acoustic signal processing ;validity ;over-sample ;resample ;anti-aliasing
1
引言
数字信号处理是现代最常用的信号处理方法,在
通信、生物医学、图像处理、信号检测、语音识别等领域有着广泛应用。笔者系统介绍了信号处理过程中对每一步骤进行可靠处理的方法,通过数学方法分析了要进行信号可靠处理的条件,并提出了抗混叠滤波方法、降低截断效应方法及抗栅栏效应[1]提高信号频域分辨率的方法。
信号处理过程包括抗混叠滤波、采样、模数转换、数字信号处理、数模转换等步骤。工程中采用时域与频域相结合的方法对信号进行分析和处理。信号处理过程中信号的前置滤波设计、采样频率选择、编码长度选
择、频率采样频率选择、时域离散信号截断等直接关系到信号处理的结果能否满足工程需要。
语音信号是时间轴上的二维信号,对语音信号处理的方法与一般信号处理方法基本一致,不同之处是:语音信号是时变信号[2],具有短时时不变性,需要对其使用窗函数截取信号帧后再进行处理,在频域对信号进行短时频谱傅里叶分析。
2信号处理过程可靠性的数学理论
研究
信号采样前,经过调理、放大、电平抬升、滤波、电平转换、光电隔离等步骤,把信号调理为传感器可采集的信号,送到采样装置前端。通过模数转换,转换为数
·论文·
*[基金项目]教育部回国人员启动基金(2009YK0500020050002)
V oice T echnology
语音技术
字信号,在数字域计算处理后,再经过数模转换,把数字信号转换为模拟信号。
2.1抗混叠滤波器理论分析
根据采样定理,当采样频率小于采样信号最高频
率2倍时,肯定会产生频谱混叠。实际工程中,根据信号频谱带宽的要求及设备的成本等选择采样器,需要对被采样信号进行前置低通滤波,也就是抗混叠滤波。
理论上通过设计截止频率为奈奎斯特频率[3](即,采样频率一半的频率)的低通滤波器就可实现,但理想的低通滤波器无法实现,只能近似接近。
2.2采样理论分析
信号经过抗混叠滤波后,进行采样。设原始信号
为x a (t ),其傅里叶变换后的频谱为X a (j Ω);无线脉冲信号
P δ(t )=+∞
n=-∞
Σδ(t-nT )
(1)
其傅里叶变换
P σ(j Ω)=2π
T
+∞
n=-∞
Σδ(Ω-n Ωs
)
(2)
采样后的信号x 赞a (t )实际上是原始连续模拟信号和无限脉冲信号相乘,即
x 赞a (t )=x a (t )·P δ(t )(3)
信号的时域相乘等效于频率的卷积,则采样信号
x
赞a (t )的频谱X
赞a (j Ω)=12πX a (j Ω)P σ(j Ω)=1T
+∞
n=-∞
ΣX a
(Ω-n Ωs
)
(4)
即,采样信号的频谱实际上是以采样频率Ωs 的整数倍为中心频率,对原带限信号进行无限延拓得到。
对采样信号x
赞a (t )经过一个截止频率为Ωs 的理想低通数字滤波器后,就得到了被采样信号的真实频谱。
因此,只要满足采样定理,就可从离散信号的频谱完全得到原模拟信号的频谱,即使采用过采样,对信号频谱特性的完整性也是无益的。理论上,满足采样定理的采样时可靠的。
设g (t )为理想低通滤波器对应的时域信号,则频域采用低通滤波器滤波后等效于在时域进行卷积。根据傅里叶逆变换,g (t )可表示为
g (t )=sin (Ωs t /2)Ωs t /2=sin (2πt /T )
2πt /T (5)
卷积,得
y a (t )=x
赞a (t )g (t )=+∞
n=-∞
Σx a (nT )sin[π(t-nT )/T ]π(t-nT )/T (6)
理论上
y a (t )=x a (t )(7)
因此,可得结论:理论上,只要满足采样定理,采样得到的时域离散信号就可无失真恢复出原始模拟信号。
由傅里叶变换定义[4],时域信号与信号频谱具有一一对应的关系。由式(3)~(7)可知,采样得到序列的频谱与原信号频谱也具有一一对应的关系;原连续模拟信号与采样序列也具有一一对应的关系。这样,理论上就可采用计算方法根据离散采样信号恢复出原模拟信号。因此,理论上,满足采样定理的采样无失真、完全可靠。
2.3频域信号处理理论分析
硬件上,信号常采用数字信号处理器(DSP )来处
理,这需要进行频域采样。设M 为频率采样点数,N 为时域信号的长度,当M>N 时,就可由频域采样X (k )恢复出时域信号x (n ),否则会产生时域混叠现象。
根据序列Z 变换定义,序列的Z 变换是唯一的。当序列满足绝对可和条件,且序列的Z 变化收敛域包含单位圆,则序列傅里叶变换实际上是Z 变换在单位圆上的取值。根据离散时间序列傅里叶变换(DTFT )定义,序列与其频谱是一一对应的。根据序列的离散傅里叶变化(DFT )
X (k )=N-1
n=0
Σx (n )e
-j 2πN
kn (8)
其逆变换
x (n )=N-1
n=0
ΣX (k )e
j 2πkn
(9)
可见,序列与其离散傅里叶变换存在一一对应的关系。
求解频域采样值与序列Z 变化的关系,设
X (z )=N-1
k=0
ΣX (k )Ψd (ω)
(10)
得
Ψd (ω)=11-e
-j ωN
1-e ()
(11)
Ψd (ω)可认为是频域采样值与序列Z 变换的插值函数。这样,序列的Z 变化与序列的离散傅里叶变换具有一一对应的关系。
可见,只要满足了频域采样定理,序列、Z 变化、离散傅里叶变换均是相互一一对应的。这时就可根据离散频域采样点完全恢复出原时域序列。因此,满足频域
*
*
Voice T echnolog
Y
语音技术
采样定理的频域采样是可靠的。
2.4模数转换理论分析
信号处理后,往往需要进行数模转换。时域离散信
号x a (nT )恢复为模拟信号的过程是在采样点之间内插的过程。根据式(6),理想低通滤波器用g (t )作为内插函数,可实现对满足采样定理的离散信号完全无失真恢复。由于g (t )是非因果序列,工程中无法完全实现,常使用零阶保持器内插,内插后会出现较高的低频分量,保持器后面通过低通滤波器可对谱线高频分量进行滤除。这样数模转换的方法是可靠的。
3
工程中提高信号可靠性的方法
工程中,无法设计理想的信号处理电路。完全按照
理想的临界处理方法处理信号肯定会产生频谱混叠。
滤波器非理想性,会引起频谱混叠;信号截断会引起谱线泄露与谱间干扰;对频域进行低分辨率采样会引起栅栏效应。因此,要可靠进行信号处理,需要存在一定的抗误差冗余度。
3.1过采样法对信号抗混叠滤波性的提高
由于滤波器非理想性,以奈奎斯特采样频率对信
号采样,肯定在奈奎斯特频率的奇数倍处产生频谱混叠。工程中采用3~5倍的奈奎斯特频率采样,可大大减小频谱混叠;缺点是增加了数字处理的数据量,系统实时性也大大降低。
这里介绍一种过采样方法[5]
,可可靠实现信号采样
而几乎不产生频谱混叠。步骤为:首先进行过采样,一般采用奈奎斯特频率的4,8倍或更高频率进行采样;采样后对得到的离散时域序列进行等间隔抽取。理论分析,得到的信号的频谱近似为原模拟信号的频谱。图1示出了带限信号的过采样过程,8倍过采样后,即使使用一阶的低通抗混叠滤波,也几乎不会产生频谱混叠。
因此,对于更高倍的过采样,可完全达到可靠的信号采集。过采样后,在数字域再进行等间距信号抽取,再对抽取的信号进行高阶低通数字滤波,得到信号的频谱基本上就等同于被采样信号的频谱。可见,过采样方法可大大提高信号的抗混叠性,提高采样可靠性。
3.2窗函数对信号截断的影响
数字计算机只能处理有限长序列信号,工程中需
要对信号截断处理。截断信号在频域上等效于信号频谱与窗函数频谱的卷积。截断窗函数长度越长,主瓣越窄,频率分辨率越高;不同的窗函数,旁瓣个数和第一旁瓣峰值增益不同。
截断处理会造成谱线向峰值周围展宽,引起谱线干扰。常用的截取窗函数有:矩形窗、汉明窗、汉宁窗,频域谱线如图2所示。汉明窗具有较低高频增益,对频率的干扰与损伤较小,最适合做窗函数。相比前两者,汉明窗截断信号是相对最可靠的。
3.3补零法与重新采样法对频率分辨率的提高离散傅里叶变换只能得到少量频域采样点处的信
息,大部分频域信息无法得到,引起栅栏效应。下面2种方法可改进栅栏效应的影响。
3.3.1末尾补零法
只要同时满足时域与频域采样定理,原模拟信
号、离散时域信号、Z 变换、离散傅里叶变换之间具有一一对应的关系。从频域采样序列便可无失真地恢复出采样前的连续时域信号。离散傅里叶变化实际上是对序列频谱的以序列长度为采样点个数进行的频域采样。
根据DTFT 定义
X (e j ω
)=+∞
n=-∞
Σx (n )e
-j n ω
(11)
对于有限长序列x (n ),其DFT 为
图2矩形窗、海明窗、海宁窗的谱线比较
120100806040200幅度
f /Hz
100
101
102
103
矩形窗海宁窗海明窗
(a )原带限信号
(b )奈奎斯特采样频率采样后的谱线分布
(c )4倍过采样
(d )8倍过采样
图1带限信号过采样过程示意图
f
f
f
f
V oice T echnology
语音技术
X (e j ω
)=N-1
n=0Σx (n )e
-j n ω
(12)
序列末尾加上M 个0,其DTFT 为X ′(e j ω
)=N-1n=0
Σx (n )e -j n ω
+M-1n=0
Σ0e -j n ω
=N-1
n=0
Σx (n )e
-j n ω
(13)
可见,
X (e j ω)=X ′(e j ω
)
(14)
因此,信号末尾插零不会改变信号的频谱。设原序列的长度为N ,根据DFT 定义,
X (k )=N-1
n=0
Σx (n )e
-j 2πN
kn (15)
序列末尾插入N 个零后的DFT 为
X ′(k )=N-1
n=0
Σx (n )e
-j 2πN+M
kn +M-1
n=0
Σ0e
-j 2πN+M
kn =
N-1
n=0
Σx (n )e
-j 2πN+M
kn (16)
末尾补零后,序列长度为N+M 。设离散时域信号的时域采样频率为f s ,则补零后频域分辨率为
f s N+M
。如图3所示,补零后,频域离散信息大大增强,而且补零越多,信息越多,信号包络越接近其连续谱线。
3.3.2重新采样法
离散傅里叶变化实际上是对序列频谱以序列点数
为采样点数进行采样得到的。对长度为N 的序列,时
域信号采样频率为f s ,离散傅里叶变换后仅能看到频率为f s N
×k ,k 个点频域采样值。这样栅栏效应很明显。
只要满足频域与时域采样定理,从DFT 频域采样序列便可无失真地恢复出采样前的连续时域信号。因此,对于频域采样点数大于离散时间序列长度的采样,不会丢失信号的谱线信息。对频域进行M 点重新采
样,得到频域分辨率为f s 。图4示出了不同采样点数
进行的重采样。点数越多,信号的频域信息越强,频域
分析更加有效。可见,重新采样法可以大大减小信号的栅栏效应。
图3末尾补零前后,不同补零点数与频域分辨率的关系
(a )时域信号
20100-10-20
510
(b )离散傅里叶变换信号(N 点
)
500-5005101520
(c )2N 个采样点的离散时域信号
6040200
-20
5
10
(d )4N 个采样点的离散时域信号
500-50
10
20
30
40
幅值
采样点数幅值
采样点数
幅值
采样点数
幅值
采样点数
图4重新采样前后,不同的频域采样点
与频域分辨率之间的关系
(d )以8N 的序列长进行重采样
50
-50
020406080
6040200-20
50
-50
010203040
(c )以4N 的序列长进行重采样
(a )时域离散序列
20100-10-200
5
10
幅值
采样点数(b )以序列长度N 进行采样后的频域信号
5
10
幅值
采样点数
幅值
采样点数
幅值
采样点数
Voice T echnolog
Y
语音技术
4
试验与结论
这里介绍声源定位系统中可靠的语音信号处理方法。设计截止频率为400Hz 的一阶低通滤波器;采用
8倍频率进行过采样。采样后对序列进行等间距的四选一抽取,抽取信号就近似等效于使用理想低通滤波后采样得到的信号。
设计电阻R =16k Ω,电容C =1μF 的一阶无源低通RC 滤波器,其截止频率为392Hz ,可满足信号处理要求。传声器阵列为4个传声器组成的方形传声器阵列,4路信号通过新华龙SOC 开发系统[6]采集后,通过串口发送到上位机,上位机运行MATLAB GUI ,对数据接收与还原,得到4路声源信号。通过抽取、低通数字滤波后,得到的信号近似与原模拟信号高品质采样后得到的信号,如图5所示。
语音信号短时处理一般选取帧长为10~30ms ,帧重叠50%左右。此实验设计帧长为30,帧重叠为15,帧的截取采用汉明窗。如果采样DFT 频域采样进行分析,分辨率为26.67Hz ,无法满足频域分析的要求。采用重新采样法,以4倍的序列长度进行重新采样后,此时频域分辨率为6.67。如图6所示。重新采样后,不会改变信号的包络,但信号频域信息大大增强。
5
总结
从信号处理的角度介绍了信号处理过程中可靠性
处理的方法。从理论上研究了信号各处理步骤之间的
图5语音信号过采样与抽取2个过程的
时域信号与频谱分布
(d )过采样信号抽取信号幅频特性
10
4
103
10
2
101
0100
200300400
(b )过采样时域信号波形的频谱
104
103102101
100
200300
400
10005000-500-1000
200
400600
(c )
过采样信号抽取信号
幅值
幅值
幅值
(a )过采样时域信号波形
1000500
0-500-1000
1000
2000
3
000
采样点数
幅值
f /Hz
采样点数
f /Hz
图6
不同频率采样点数与离散频域
分辨率的对比
10
2030
(a )语音信号帧信号
4002000-200-400
采样点数幅值
200015001000500幅值
f /Hz
200
400
600
(b )语音帧的频谱分布
200015001000500200
400600
(c )语音帧的离散傅里叶频谱
幅值
f /Hz
(d )语音帧的离散频谱4倍离散点重采样
200015001000500
幅值
f /Hz
200
400600
(下转第70页)
V oice T echnology
语音技术
数学关系及信号可靠处理条件。提出了过采样提高抗混叠性能方法,分析了不同窗函数与谱线混叠和展宽的关系,提出了序列末尾补零法与重新采样法可以降低信号的栅栏效应。通过低频声源定位系统的实验,证实所提出的方法可大大提高信号处理的可靠性。
参考文献
[1]丁玉梅,高西全.数字信号处理[M].西安:西安电子科技大学出版社,2001:83-86.
[2]张莉,吕明.基于传声器阵列的声源定位方法研究[D].成都:电子科技大学,2004:19-20.
[3]
PROAKIS J G ,MANOLAKIS D G.Digital signal process -ing :principle ,algorithms and application[M].Upper Sad -
dle River :Pearson Prentice Hall ,2007.[4]冷建华.傅里叶变化[M].北京:清华大学出版社,2004.
[5]
CHEN W ,HAN B ,JIA Rong-qing.On simple over-sampled A/D conversion in shift-invariant spaces [J].IEEE Trans.on Inf.Theory ,2005,51(2):8.
[6]Technical Department of Silicon Labs.C8051f020混合信
号微控制器使用手册[G].潘卓金,译.Austin :SLAB ,2007.
作者简介
梁晓辉,硕士研究生,主要研究方向为声学信号处理、信号采集与测量等。
[责任编辑]侯莉[收稿日期]2010-01-20
检测
EndSub
Private Sub ring (ByValsenderAsSystem.Object ,ByValeAs System.Timers.ElapsedEventArgs )′振铃信号检测
If SsmGetChState (0)=2Then ′若通道振铃SsmPickup (0)′摘机
CallWelcome ()′播放操作提示EndIf EndSub
Private Sub Rec_DTMF (ByValsenderAsSystem.Object ,ByValeAs System.Timers.ElapsedEventArgs )′判断按键并执行相应的操作
Dim tmp As Object
CallTimer=Format (Now ,“yyyymmddhhmmss ”)&“.wav ”SsmSetDtmfStopPlay (0,1)′停止放音If SsmGetRxDtmfLen (0)>=1Then SsmGet1stDtmf (0,tmp )
SsmClearRxDtmfBuf (0)′清除DTMF 缓冲,接收新按键字符Select Case tmp ′判断按下的按键,并执行相应的操作
CaseAsc (“1”)
SsmRecToFile (0,My.Application.Info.Directory
Path&“\\Record\\”&CallTimer ,6,0,60000,0,0)
CaseAsc (“2”)
SHPlayText (0,“留言结束,继续操作请按三
号键”)
SsmStopRecToFile (0)CaseAsc (“3”)
CallWelcome ()EndSelect EndIf
EndSub
5
结语
在社区当中应用电话自动化服务,可以为社区服
务工作提供便利。社区工作人员可以确保信息通知到个人,而退休人员在家中就可以获取信息;退休人员可以拨打社区电话进行留言,将问题反映给社区,由社区来处理;退休人员也可以通过电话查询到一些经费、等相关信息。通过实际开发应用表明自动通知、语音信箱、语音查询等社区电话自动化服务成本低廉,功能满足应用要求。
参考文献
[1]李爱振.CTI 技术与呼叫中心[M].北京:电子工业出版社,2002.
[2]MICHAEL B.计算机电话系统-CTI 与呼叫中心[M].姜晓
铭,杨水超,史进,等,译.北京:电子工业出版社,2002.[3]张跃廷,王小科.ASP.NET 数据库系统开发完全手册[M].北京:人民邮电出版社,2007.
[4]赵孔新,董娜,李司宇.G.729AB 语音编解码的研究及其在S3C2440上的实现[J].电声技术,2008,32(6):49-52.[5]宋俊德,段云峰.计算机电话集成技术[M].2版.北京:人民邮电出版社,2000.
[6]卢镇波,李青,万晶.Visual Basic.NET 实用编程百例[M].北京:清华大学出版社,2005.
[7]
杨明极,梁晶.具有语音合成的车载蓝牙免提系统设计与实现[J].电声技术,2009,33(1):36-40.
作者简介
胡寅,硕士研究生,主要研究方向为计算机控制与检测技术等。
[责任编辑]闫雯雯[收稿日期]2009-12-19
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(上接第62页)
通信电声
C ommunication Electroacoustics