
随机过程与随机信号处理
课程论文
姓名 王誉都
专业 23系信号与信息处理
单位 中科院上海技术物理研究所
时间 2015.1.5
摘要
随机信号理论在它形成的初期,便在通信、雷达、导航以及密码学等领域中获得了广泛的应用。近年来,随着对随机信号理论研究的进一步深入,人们对随机信号有了更多的认识,随机信号的实际应用也越来越多。其应用范围从上述领域扩展到自动控制、计算机、声学和光学测量、数字式跟踪和测距系统以及数字网络系统的故障检测等方面。在这些应用中,随机信号(或序列)的产生是至关重要的,而产生随机信号的性能也对其在实际应用中的效果有着很大的影响。
论文首先对一些随机信号的产生方法进行了介绍,以及随机信号的应用实例。接下来讨论了随机数发生机制,包括均匀分布、高斯分布和指数分布的随机数的实现方法。
在文章的最后对非平稳随进信号进行了介绍。
关键字:随机信号,随机过程,随机数,非平稳随机过程
第一章 绪论
1.1随机信号概述
随机信号是指没有确定的变化形式,变化的过程不可能用一个或几个时间的确定函数来描述的信号。
噪声是随机信号的一种最为常见的形式。它可能来自于人为的干扰,包括通信系统间的干扰、整流子火花、汽车点火等,也可能存在于产生噪声的自然现象中,包括大气扰动、宇宙辐射以及随机的电子运动等。
噪声的种类很多,最常见的就是白噪声。白噪声在整个频谱内每个频点的能量为常数,且基本恒定。正是因为白噪声存在于整个频带范围内,因此,不管对其进行低通还是高通滤波处理,均不能有效地滤除。
白色包含了所有的颜色,因此,白噪声的特点就是包含各种噪声。白噪声定义为在无限频率范围内功率密度为常数的信号,这就意味着还存在其它“颜色”的噪声,我们将这一类噪声统称为色噪声,主要包括:
1.粉红噪声:在给定频率范围内(不包含直流成分),随着频率的增加,其功率密度每倍频程下降3dB(密度与频率成反比)。
2.红噪声(海洋学概念):这是有关海洋环境的一种噪声,由于它是有选择地吸收较高的频率,因此称之为红噪声。
3.橙色噪声:该类噪声是准静态噪声,在整个连续频谱范围内,功率谱有限且零功率窄带信号数量也有限。这些零功率的窄带信号集中于任意相关音符系统的音符频率中心上。由于消除了所有的合音,这些剩余频谱就称为“橙色”音符。
4.蓝噪声:在有限频率范围内,功率密度随频率的增加每倍频增长3dB(密度正比于频率)。
5.紫噪声:在有限频率范围内,功率密度随频率的增加每倍频增长6dB(密度正比于频率的平方值)。
6.灰色噪声:该噪声在给定频率范围内,类似于心理声学上的等响度曲线(如反向的A一加权曲线),因此在所有频率点的噪声电平相同。
7.棕色噪声:在不包含直流成分的有限频率范围内,功率密度随频率的增加每倍频下降6dB(密度与频率的平方成反比)。该噪声实际上是布朗运动产生的噪声,它也称为随机飘移噪声或醉鬼噪声。
8.黑噪声(静止噪声):(1)有源噪声控制系统在消除了一个现有噪声后的输出信号;(2)在20kHz以上的有限频率范围内,功率密度为常数的噪声,一定程度上它类似于超声波白噪声。这种黑噪声就像“黑光”一样,由于频率太高而使人们无法感知,但它对你和你周围的环境仍然有影响;(3)具有fβ谱,其中β>2。
根据经验可知,该噪声的危害性很大。
一直以来,人们认为噪声是有害的。例如,它的存在往往会导致通信、电子电路等系统的性能下降,因此,系统设计者们在设计系统时,会想方设法的去抑制或消除它对系统的影响。著名的香农定理指出,在噪声与信号的高斯白噪声信道中,假设信号的功率为S,噪声功率为N,信道通频带宽为B(Hz),则该信道的信道容量C满足
| (1.1.1) |
1.2随机信号的应用
1.2.1在蒙特卡罗(Monte Carlo)方法中的应用
蒙特卡罗(Monte Carlo)方法,或称计算机随机模拟方法,是一种基于“随机数”的计算方法。这一方法源于美国在第二次世界大战时研制原子弹的“曼哈顿计划”,该计划的主持人之一数学家冯诺伊曼用驰名世界的摩纳哥的Monte Carfo来命名这种方法。
Monte Carfo方法的基本思想很早以前就被人们所发现和利用。早在17世纪,人们就知道用事件发生的“频率”来决定事件的“概率”。19世纪人们用投针试验的方法来决定圆周率。20世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。考虑平面上的一个边长为1的正方形及其内部的一个形状不规则的“图形”,可以采用Monte Carfo方法求出这个“图形”的面积:向该正方形“随机地”投掷N个点(用随机序列发生器产生),假设有M个点落于“图形”内,则该“图形”的面积近似为M/N。
科技计算中的问题比这个要复杂得多。比如金融衍生产品(期权、期货、掉期等)的定价及交易风险估算,问题的维数(即变量的个数)可能高达数百甚至数千。对这类问题,难度随维数的增加呈指数增长,这就是所谓的“维数的灾难”,传统的数值方法难以对付(即使使用速度最快的计算机)。Monte Carfo方法能很好地用来对付维数的灾难,因为该方法的计算复杂性不再依赖于维数。以前那些本来是无法计算的问题现在也能够计算了。Monte Carfo方法由于其简单性、灵活性和普遍性而获得了广泛应用。
1.2.2在扩频通信中的应用
| 图1.2.2.1扩频通信发射系统 |
直接序列扩频系统具有抗干扰性强、隐蔽性好、易于实现码分多址(CDMA)、抗多径干扰能力强、通信速率高等有点,特别适合小容量军用卫星通信、战术电台通信网、计算机无线网、及其它移动通信系统中。
1.2.3在密码学中的应用
| 加密:E:(X,K)->Y | 解密:D:(Y,K)->X |
| 图1.2.3.1 对称加密算法加/解密的基本模型 | |
密码学问题就是随机性的利用问题,随机数是许多加密应用的基础,其作用是生成Diffie一Hellman、形vest一Shamir-Adelman和数字签名等算法所需的公共/专用密钥对,并为大批量加密算法和IPsec分别生成初始向量和即时随机数,此外,大量其它类型的安全协议也靠随机数发生器的不可预测性来防止系统被破解。
1.2.4在随机信号雷达中的应用
随机信号雷达作为一种新型的雷达,一经问世就为人所关注。早在上世纪60年代美国和欧洲的随机信号雷达给予了广泛的关注,相继发表了多篇关于随机信号雷达的文献。60年代末期,美国Purdue大学最早研制了一部试验型随机信号雷达。与此同时,法国的carpenter教授讨论了工作在米波波段的相关法随机信号雷达,荷兰也进行了相关法随机信号雷达的系统试验141。70年代中期,美国Mirmesota大学的Kaveh教授发表了多篇关于随机交错脉冲随机信号雷达的文献,己经开始试图将随机信号应用到脉冲雷达当中,多项有关随机信号雷达的美国专利也被公布。同时,英国London大学的Forrest等人也发表了关于固态随机信号雷达的研究报告。从上面诸多论文和发明专利来看,自从60年代开始研究随机信号雷达以来,美国和欧洲各国对随机信号雷达的理论基础分析和试验样机的研制都开展了大量的工作,并取得了一定的成效。但是在当时,由于受到电子元器件的制造工艺和技术水平的,关于随机信号雷达的研究大多数还仅限于理论分析阶段,随机信号雷达的研究也一度陷人低潮。
上世纪80年代以后,随着电子技术的发展,各种固态微波器件和超大规模集成电路的出现给了随机信号雷达以实现的可能,国外对随机信号雷达的应用性研究逐渐增多。尤其是90年代以来,美国将随机信号雷达用于地质勘探、活动目标识别、微波成像等应用场合取得了可喜的成果。此外,在乌克兰和意大利利用随机信号雷达在近程的应用,德国在随机信号雷达的理论和实际特性的研究中都取得了一些有价值的结果。
经过三十余年的随机信号雷达的研究证实,随机信号雷达具有低截获率、抗干扰、测量目标的高鉴别能力、电磁兼容能力、高精度和优良的目标检测性能,可以解决远距离的高速目标测量,解决多普勒敏感困难等问题。它的许多优良性能是其他雷达无法比拟的。
随机信号雷达的基本工作方式包括相关法、频谱法和反相关法。无论采用何种工作方式,随机信号源是必不可少的。
1.3数字随机信号的产生
从上一节介绍的几种应用实例中可以看到,每个应用都需要用到随机信号(或序列),因此,随机信号的产生也就显得十分重要。产生的随机信号根据应用场合的不同,对其要求也不相同,因此所采用的产生方法也就不同。本文将分别讨论基于混沌理论、元胞自动机理论的随机数产生算法,以及用来产生高斯分布随机数的Ziggurat算法。
第二章 随机数发生机制
概率密度函数或对分布函数随可较为完整地描述随机数的生成过程。但在实践中的概率密度函数和分布函数在大多数情况下是未知的。因此求其次,去求随机变量的某些数字特征。一方面,在许多实际问题中并不需要完全知道分布函数,而只需要知道随机变量的某些数字特征就够了。例如,测量接收机输出端的噪声电压,往往用测量的平均数来代替它的理论真值;而另一方面,某些随机变量的分布函数或概率密度函数,仅由其中的几个参数(数字特征)来确定,如正态分布的概率密度函数,只要知道它的均值和方差两个参数就可以了。
由随机过程的理论可知,任何分布都可由均勻分布推导变换得到。所以,良好的随机数生成的关键取决于[0,1]区间上均勻随机数的质量。
2.1均匀分布的随机数实现方法
均匀分布的随机数是指均匀出现在分布区间上同时出现的概率也是相同的随机数,因为均匀分布随机数可以通过运算变换成其他分布随机数,所以均匀分布随机数性能的好坏会直接影响到其所产生其他随机数的性能。为满足实际应用,随机数需满足以下需求:
1. 非预测性,也就是无法预测当前的随机数将生成的下一个随机是什么样的,只是因为随机数序列中的数相互间有不相关性,并且该序列中包含的任意子序列之间也具有不相关性。
2. 非重复性,即随机序列的周期需满足尽量无穷大,伪随机数序列在实践中的周期通常由数学算法生成的,因此其必具备一定的周期性。假设把伪随机序列当成真随机序列来使用只有在周期是无穷大的情况下才能保证该序列的不相关性和均匀性。但在实际应用中,采用周期无穷大的序列会占用大量的存储空间和内存,并且计算时间也会加长,所以为避免这样的情况,应使得随机数的周期尽量的长。
在满足以上条件后,随机序列必须通过随机性统计检测才能确保证随机数的质量以及信息安全方可投入到实际应用中。几种常用到的均匀分布随机数生成算法介绍如下。
1.线性同余法
性同余法是利用计算机生成均匀随机数目前最普遍的方法,简称LCG法(Linear Congruence Generator),此方法是在1951年由Lehmer提出的一种利用数论中的同余运算原理来生成随机数的方法。其数学模型如下:
| (2.1) |
| (2.2) |
2.素数模乘同余法
若使乘同余法能够产生满足实际需求的随机数则需选取适当的参数已得到更长的周期,其参数的优选原则需首先满足为奇数;其次所选乘子可使所有余数在一个周期内出现的次数为一;最后和需为超素数,并且满足。假设采用超素数法,在增量不为常数且为逐次加一的情况下,优先参,此时的周期长度为,其数学描述式为:
| (2.3) |
LFSR线性反馈移位寄存器法是在反馈移位寄存器法的基础上提出的一种方法,其数学描述式如下:
| (2.4) |
| (2.5) |
2.2高斯分布的随机数实现方法
1. 高斯分布的数学描述
高斯分布即正态分布,一个连续型随机变量的高斯分布概率密度为:
| (2.6) |
2.中心极限定理法
中心极限定理法是在研究随机变量和极限分布为正态分布问题最常用到的一种方法。中心极限定理:从一总体样本中任意抽取样本量为的样本(该总体样本的均值为,方差为),当充分大时,所抽取样本的样本均值抽样亦近似服从均值为,方差为的正态分布。
设一组相互的随机变量为这组变量均服从同一均匀分布并具有相同的均值和方差:,,那么随机变量有:
| (2.7) |
| (2.8) |
| (2.9) |
3. Box-Muller 算法
国内在近几年才开始关注产生高斯分布随机数领域中的Box-Muller算法,该算法是一种基于硬件实现的算法,也是最早用于生成高斯白噪声的算法之一。Boutillonetal是首位在硬件的基础上釆用该算法来实现高斯随机数发生器的研究者。
Box-Muller算法会严格的要求输入的均匀随机数必须有一个非0值,并且在.反变换运算时也要求其输入必须小于1, Box-Muller算法可将两个均匀随机数同时转换成两个高斯随机数。
假设有两个相互且服从标准正态分布的值,分别为和,那么则有,分别服从瑞丽分布和均匀分布,由此可将一对服从瑞丽分布以及服从均勾分布的随机变量通过变换而得到一对高斯变量。具体变换如下:
| (2.10) |
2.3指数分布的随机数实现方法
1.数学描述
连续型随机变量的指数分布概率密度为:
| (2.11) |
2.反函数法
所谓的反函数为即为在已知的[0,1]区间上,将所有所需均匀分布的随机数的概率分布函数进行反变换,从而得到其反函数,该反函数就是概率分布函数的伪随机数。
随机变量X的指数分布函数为:
| (2.12) |
| (2.13) |
第三章 非平稳随机信号简介
3.1非平稳随机信号的分析、处理与应用
近年来大规模集成电路与计算机的迅速发展,有力地推动了信号处理的发展,使信号处理的理论和方法日趋系统化,并被广泛地应用于雷达、声纳、通信、自动化、地球物理、航天工程、生物医学、天文、振动工程等几乎所有技术领域。同时,由于信号处理应用领域的不断扩大,也促使人们在信号处理理论和方法上向更深的层次探索。
从信号存在的可能性考虑,信号可以分为确定性的与随机的。确定性信号可以准确地用一个确定性的时间函数来描述,并可以准确地加以重现。而随机信号不能用确定性的时间函数来描述,也不能准确地加以重现。
随机信号可以分成平稳随机信号和非平稳随机信号。所谓非平稳随机信号亦即其统计特性是时间的函数。严格地说,许多实际信号都是属于非平稳随机信号,但是由于受理论条件的,在80年代以前,人们对于信号进行分析仅仅局限于平稳的情况,进入80年代以后,随着信号处理理论与应用的发展,对于非平稳随机信号分析与处理的研究逐渐受到人们的广泛关注,并日益发展起来。
非平稳随机信号分析与处理作为近年来新兴的一个重要领域,由于其技术的先进性和应用的广泛性,越来越显示出强大的生命力。特别是近年来大规模集成电路和计算机的发展,为非平稳随机信号分析与处理的实现提供了可能,而非平稳随机信号理论与方法上的发展,也促使其应用领域不断扩大。
3.1.1语音信号处理
语音信号是时变参数信号,其参数随时间缓慢变化。通常是采用加移动窗的短时傅氏谱或短时段内定常参数模型识别的方法进行分析。但是短时傅氏谱需要在时间分辨率和频率分辨率之间进行折衷考虑,或是短数据段所达到的精确性和谱所被跟踪的真实性之间进行折衷考虑。例如,在一个语音识别系统中,一个典型的分段长度是25ms,这个时间长度适合大多数的情况,但是对于快速变化的语音情况则不适合,需要应用非平稳随机信号分析与处理技术。
3.1.2雷达与声呐信号处理
雷达和声纳接收到的随机信号通常是由埋在背景噪声中的信号组成,由于多普勒效应,目标辐射信号的中心频率随目标的运动而变化。同时,介质的传播特性也随时间而变化,并引起附加的非平稳性。以往的工作通常是忽略了信号的非平稳性而假设信号在观测时间内是平稳的,由回波信号功率谱密度,谱峰的宽度和位置来确定运动目标的位置、运动速度等。近年来随着宽带或超宽带雷达技术的发展,可以得到目标精细(高分辨)的结构图象,这一高分辨结构图象比传统的点目标回波具有更多的局部起伏特性,特别是冲激雷达或噪声雷达所得到的回波信号是瞬变的,从广义上来说是一种非平稳过程,需要应用非平稳随机信号分析与处理技术。
3.1.3非平稳随机振动分析
提取设备振动信号频域特征信息的常用方法是傅立叶变换。假如设备的振动信号是近似平稳与线性的,用傅立叶变换是有效的。但是,在以设备振动信号为状态参量的设备运行状态检测与故障诊断中,一方面,因设备运行转速的不稳定、载荷的变化以及因设备故障产生的冲击、摩擦导致非平稳与非线性振动的产生,基于平稳过程与线性过程的传统信号处理理论难以发挥作用,这种情况下就需要能处理非平稳与非线性信号的时频分析方法。
总之,时频分析技术在其发展之初,其应用潜力就已初露端倪。这一技术的长足进展,为许多难题的解决带来了曙光。它所涉及的应用领域非常广泛,除了以上所述之外,目前时频分析在地震信号处理、信号重构以及扩频通信中的干扰抑制御等方面已都有成功的应用。
3.2非平稳随机信号参数模型法简介
在平稳随机过程情况下,参数模型法主要是先根据过程的先验信息(或一些假定)建立一个准确模型来表征所给定采样数据的过程或选择一个较好的近似实际的模型,其次是采用采样数据序列或自相关延迟序列(可以是己知的,或者是利用采样数据序列作出的估计)估计该模型的参数,最后把估计的模型参数代进与该模型对应的理率谱表达式,以得到所需要的谱估计。
平稳随机过程的参数模型是常参数模型,特别适用于短数据序列的谱估计,可获得高的谱分辨率。当数据序列是沿整个信号序列滑动而得时,就形成信号的自适应AR谱。对非平稳随机信号,在短数据序列段内可以认为是平稳随机的,故可用自适应AR谱分析法来研究。但其条件是在短时间内信号应是平稳随机的,例如在语音分析、合成及识别中,其短时段约为25毫秒。这一短时持续时间对多数现象均比较适宜,但对一些变化非常快的现象如爆炸等则嫌太长,对此需用非平稳随机信号的时变参数模型法来研究。虽然在20世纪70年代对非平稳随机信号时变参数模型已有一些开创性工作,后来却没有进展,直到1983年YGrenier对其进行了深入研究,将一些熟知的时不变参数模型法如AR模型法、ARMA模型法及普罗尼(Prony)法等扩展为时变参数模型情况。
此外,在许多实际应用中,所考虑的信号虽并不是平稳随机的,但经过一定处理后所得的信号,可以近似地看做是平稳随机的,从而能用研究平稳随机信号的理论方法来解决,如分段平稳随机信号、方差平稳随机信号。
参考文献
[1]. 盛骤等.概率论与数理统计.第二版.北京:高等教育出版社,2001.
[2]. 李庆扬等.数值分析.第一版.北京:清华大学出版社,2001.
[3]. 曾峰等. PowerPCB高速电子电路设计与应用.第1版.北京:电子工业出版社,2004.
[4]. 王宏禹.非平稳随机信号分析与处理,国防工业出版社,1999.
[5]. 王文华,王宏禹.非平稳信号的一种ARMA模型参数估计法.信号处理,1998.
[6]. 潘建寿,王琳,严鹏.随机信号分析及应用.北京:清华大学出版社,2011.
[7]. 楼久怀.不同分布的随机数发生器的研究和设计[D].浙江大学,2006.
[8]. 夏文宇.Verilog数字系统设计教程[M].北京:北京航空航天大学出版社,2003.
