
课程名称 ____________语音信号处理__________________
实验项目 语音信号的时域特征与频域特征
实验仪器 __台式计算机、Matlab软件、Cool Edit__
系 别____信息与通信工程学院_____
专 业_____电子信息工程专业______
班级/学号_____
学生姓名 ___________________
实验日期 _______2013/4/17________
成 绩 _________________________
指导教师 _____________________
实验一:语音信号的时域特征与频域特征
一、实验目的
使学生通过本实验观察语音信号在时域和频域的基本特征(语音波形、基音频率、过零数、共振峰),验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。
二、实验内容
学习音频编辑软件Cool Edit的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率)、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅)。
三、实验原理
元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流暂时被阻不能通过或只能勉强挤出去。
元音具有基音与共振峰结构,辅音则不具有这两者。
基音由声带振动频率产生,决定语音的音高、音调。在语音波形中表现为准周期峰值。
共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。
四、实验方法与实验步骤
(一)音频编辑软件Cool Edit的使用方法及语音文件的建立
点击桌面上“cool edit”图标,选不同项可激活cool edit菜单中不同功能。
点击“file”菜单中的“new”,设抽样频率为8KHz,单声道“mono”,“8 bit”。
点击“Record”录音,将录音存成“.wav”文件。
④点击菜单中“View”中的“Spectral View”可观看语谱图。
⑤点击菜单中“Analyze”中的“Frequence Analysis”可分析频谱。
⑥点击菜单中“Effects”中的“Amplitude”可改变幅度。
(二)观察语音时域特征
在E盘或D盘建立实验者本人的文件夹,然后做以下实验。
发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、“e.wav”、“u.wav”文件,存在本人的文件夹中。
利用Cool Edit打开并观察以上语音数据的波形。
③元音波形中的准周期结构与声带振动频率对应,其周期称为“基音周期”(其倒数为基音频率),利用Cool Edit观察元音的波形,记录每个元音的前部、中部和后部的各一个基音周期。
④记录每个元音的任意一个基音周期中的过零数。
⑤ 共振峰是语音频谱的峰状区域,利用Cool Edit观察上述每个元音的频谱,记录每个元音的前三个共振峰的数值。
波形截图:
图(1)元音a前部
图(2)元音a中部
图(3)元音a后部
图(4)元音i前部
图(5)元音i中部
图(6)元音i后部
图(7)元音e前部
图(8)元音e中部
图(9)元音e后部
图(10)元音u前部
图(11)元音u中部
图(12)元音u后部
图(15)元音e的共振峰频率分析图
图(13)元音a的共 振峰频率分析图
图(14)元音i的共 振峰频率分析图
图(16)元音u的共振峰频率分析图
(三)观察语音频域特征
对你发的【a】、【i】、【e】、【u】这四个元音中每一个元音,分别选取稳定段的256个抽样,利用 Matlab 的 FFT计算其频谱,并利用subplot命令以波形和频谱对应的形式画出图形。部分参考程序如下
y = wavread('e.wav');
t=1:length(y);
y2 = wavread('e.wav',[4000 4512]);
y2F=fft(y2);
subplot(3,1,1)
plot(t,y,'-b',4000,[0.2:0.005:0.4],'-r',4512,[0.2:0.005:0.4],'-r')
subplot(3,1,2),plot(y2);grid on
subplot(3,1,3), plot(log(abs(y2F)));grid on
Matlab程序结果截图
图(17)元音a的时域波形和频域波形
图(20)元音u的时域波形和频域波形
图(19)元音e的时域波形和频域波形
图(18)元音i的时域波形和频域波形
表1 实验数据记录表
| 基音频率 | 过零率 | 共振峰(dB) | |||||
| 前 | 中 | 后 | 0Hz | 148Hz | 290Hz | ||
| a | 66 | 53 | 55 | 13 | -41.91 | -50.36 | -50.14 |
| i | 50 | 52 | 53 | 14 | -42.07 | -52.74 | -53.13 |
| e | 49 | 52 | 53 | 16 | -43.42 | -52.03 | -53.23 |
| u | 56 | 57 | 60 | 10 | -45.74 | -51. | -52.61 |
(1)共振峰与语音波形有什么相关之处?
答:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。 在语音声学中,共振峰决定着元音的音质,而在计算机音乐中,它们是决定音色和音质的重要参数。 共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。因此,不同的语音波形有不同的与之对应的共振峰模式。
(2)基音周期与音调的高低有什么对应关系?
答:基音由声带振动频率产生,决定语音的音高、音调。因此,音调的高低决定了基因频率,从而决定了基因周期大小。
六、实验收获
