独立分量分析的作用范文

时间：2022-03-20 03:02:52

独立分量分析的作用

1独立分量分析

独立分量分析(independentcomponentanalysis,ICA)是基于信号高阶统计量的信号处理方法,其基本含义是将多道观测信号按照统计独立的原则通过优化算法分解为若干独立成分,前提是各源信号为彼此统计独立的非高斯信号。与主分量分析(prin-cipalcomponentanalysis,PCA)相比,ICA不仅实现了信号的去相关,而且要求各高阶统计量独立。1994年,Comon[1]系统地分析了瞬时混迭信号盲源分离问题,提出了ICA的概念与基本假设条件,并基于累积量直接构造了目标函数,进而指出ICA是PCA的扩展和推广。20世纪90年代中期,Bell和Sejnowski[2]提出随机梯度下降学习算法,即最大熵ICA算法(Infomax-ICA)。近年ICA在众多领域得到广泛应用,主要得益于Lee等提出的扩展ICA算法[3]、Hyvarinen的定点ICA算法[4]与Cardoso的JADE算法[5]。

2ICA模型

设有m个未知的源信号si(t),i=1~m,构成一个列向量s(t)=[s1(t),s2(t),…,sm(t)]T,设A是一个n×m维矩阵,一般称为混合矩阵(mixingmatrix)。设x(t)=[x1(t),x2(t),…,xn(t)]T是由n个观测信号xi(t),i=1~n构成的列向量,n(t)为n维附加噪声,其瞬时线性混合模型(图1)表示为下式:x(t)=As(t)+n(t),n≥m(1)一般情况下,噪声可以忽略不计。则ICA模型可以简化为:x(t)=As(t),n≥m(2)ICA的命题是:对任何t,根据已知的x(t)在A生物医学工程研究JournalofBiomedicalEngineeringResearch未知的条件下求解未知的s(t)。这就构成一个无噪声的盲分离问题。ICA的思路是设置一个解混矩阵W(W∈Rm×n),使得x经过W变换后得到n维输出列向量y(t),即y(t)=Wx(t)=WAs(t)(3)如果通过学习实现了WA=I(I为单位阵),则y(t)=s(t),从而达到分离源信号的目的。根据概率论中心极限定理,两个独立随机变量和的高斯性通常比原来任何一个的高斯性都要强。信号分离的过程,就是神经网络输出的各分量非高斯性(即独立性)增强的过程。由于没有任何参照目标,学习只能是自组织的。学习过程的第一步是建立以W为变量的目标函数L(W),如果某个W能使L(W)达到极值,该W即为所需的解;第二步是用一种有效的算法求解W。按照L(W)定义的不同和求W的算法不同,可以构成各种ICA算法。目标函数的定义可以分为基于高阶统计和基于信息论的方法。

3ICA判据与算法

用ICA解决BSS问题,一般基于以下假设:①各源信号si(t)统计独立;②观测信号数n≥源信号数m;③各源信号si(t)中至多允许有一个高斯分布的信号源;④各传感器引入的噪声很小。ICA理论及分离算法的关键在于如何度量分离结果的独立性。

3.1基于非高斯最大化的ICA

直观的说,非高斯性是ICA模型估计的关键。采用峭度(kurtosis)和负熵(negentropy)可以度量非高斯性的大小。

3.1.1基于峭度高阶统计量的判据随机变量y(t)没有归一化的峭度,也称作四阶累积量,定义为:kurt(y)=E{y4}-3(E{y2})2=C4[y4](4)对高斯信号变量来说,它的kurtosis等于零;但对大多数非高斯随机变量而言,它们的kurtosis有正也有负。声音信号等具有正kurtosis值的信号称为超高斯信号,生物医学信号、图像信号、通信信号等具有负kurtosis值的信号称作亚高斯信号。由于该度量方法在理论和计算上都非常简单,因此广泛用于ICA和相关领域。

3.1.2基于负熵的ICA目标函数由信息论理论可知,在所有具有等方差的随机变量中,高斯分布的随机变量的信息熵最大,非高斯性越强,其信息熵越小。这表明熵能用于非高斯性的测量。负熵定义如下:J(y)∝H(ygauss)-H(y)(5)其中,H(y)=∫f(y)logf(y)dy,ygauss是一与y具有相同协方差的高斯随机变量。负熵总是非负的,并只有当y是高斯分布时为零。实际应用中为简化计算,通常要对负熵加以近似[6]:J(y)∝[E{G(y)}-E{G(ν)}]2(6)其中,ν为零均值单位方差的高斯向量,y的均值为零,且是单位方差;G(•)可取为G1(u)=1a1log-cosha1u(1≤a1≤2)或G2(u)=-exp(-u2/2)等非二次函数。这种近似得到的负熵,给出了古典的kurto-sis和负熵在非高斯性测量上的一种很好的折衷,其近似概念简单,计算快速,具有较好的鲁棒性。

3.2基于信息论的ICA

3.2.1基于极大似然(ML)估计的ICA在ICA模型中可以直接定义似然函数(对数形式)如下:logL=∑Tt=1∑ni=1logfi(wWix(t))+Tlog|detW|(7)其中,fi为独立分量si的密度函数(假设pdf已知),x(t)(t=1,2,…,T)是x的实现,该式也可表示为:1TlogL=E{∑ni=1logfi(wTix)}+log|detW|(8)在实际的ML估计中,独立分量的pdf也不必精确的估计出来。事实上,只要能够确定独立分量的超高斯或亚高斯性即可。但是,对独立分量先验知识的错误认知,会导致完全错误的结果。

3.2.2基于信息最大化的ICAInfomax算法充分利用神经网络的知识,其原理是最大化一个具有非线性输出神经网络的输出熵(或信息流)。假设x是一个输出形式为Φi(wiTx)的神经网络输入,这里Φi是一些非线性标量函数,wi是神经网络的权向量,得到最大化输出的熵为:H(Φ1,…,Φn)=H(x)+E{log│detF/W(x)│}(9)式中F(x)=(Φ1(w1Tx),…,Φn(wnTx))。57第4期赵浩等•独立分量分析在生物医学信号处理中的应用E{log│detF/W(x)│}=∑Ni=1E{logΦ′i(wiTx)}+log│detW│(10)比较式(8)与式(10),可以看出输出熵同似然函数的期望值有相同的形式。在此处,独立分量的pdf被函数Φ′i代替。如果此处的非线性函数Φ′i采用相应于累计的分布函数,比如说Φ′I(•)=fi(•),那么输出熵则等于似然值。所以Infomax和MLE是等价的。

3.2.3基于最小互信息(MMI)的ICA根据信息论中互信息的定义,考虑到线性关系y(t)=Wx(t),可得基于最小互信息的目标函数I(y1,y2,…yn)=∑iH(yi)-H(x)-log|detW|(11)最小化该式即可得到分离矩阵W,使yi(t)趋于相互独立。

3.3ICA的学习算法

ICA的学习算法可分为两类,一类是求取相关目标函数的极值,另一类是基于随机梯度方法的自适应算法。一种好的学习算法应保证解的正确性,并且算法简单,收敛速度快。近年Lee等提出了扩展ICA算法[3],该算法在迭代过程中不需要计算信号的高阶统计量,收敛速度快,可实现亚高斯和超高斯信号的同步分离。FastICA算法是一种基于负熵或极大似然估计等独立性判决准则的分离算法[4],该算法是基于定点递推算法得到的。FastICA收敛速度快,不需要选择步长,独立成分可以逐个估计,并具有很多神经算法的优点,如计算简单,需求的内存小,是并行的。基于负熵的一维FastICA算法能估计其中的一个独立分量,或者说是一个投影,其步骤如下:(1)中心化观测数据,使其均值为零;并对观测数据进行白化预处理,初始权值向量W;(2)利用定点准则计算下一个ICA基本向量的估计:W(k)=E{xg(W(k-1)Tx)}-E{g′(WT(k-1)x)}W(12)式中g(•)为g1(u)=tanh(a1u)(1<a1<2,经常置a1=1)或g2(u)=uexp(-u2/2);(3)将W(k)标准化,即W(k)除以它的范数,W(k)=W(k)/‖W(k)‖;(4)如果不收敛,则返回第2步。

4ICA在生物医学信号处理中的应用

生物医学信号的采集设备一般由各类传感器、运算放大器、滤波器、AD/DA转换、预处理等模块构成,生物医学信号比较微弱,一般处在微伏级,暴露于大量的背景噪声和传感器噪声中,并且电路可能存在不同的内部时钟和传输转换时延,各通道间存在串扰和迭加,干扰信号的幅度可能比有用信号的幅度还要强,具有较强的非平稳性和随机性等普遍特征。如何在保证信号特征基本不变的前提下,对其进行去噪提纯,继而进行信号的特征提取和压缩,改善其存储、检索及模式自动识别等问题,是医疗自动化和信息化的重要课题。由于ICA是根据观测信号和源信号的概率分布来估计各源信号,考虑信号的高阶统计特性,因而能有效的提升信号的信噪比,是一种非常有效的处理方法。众多的科技工作者已经把ICA用于生物医学信号的研究。其中,Lee等把扩展ICA用于EEG和fM-RI数据的处理[3];Common提出的基于高阶累计量的算法也被用于分离胎儿和母体的ECG[7];FastICA固定点算法也被用于EEG和MEG数据———脑的电子和电磁活动行为[8],等等。但是,各算法的最优结果和各算法的鲁棒性还有待进一步确定,这也正是我们当前的研究方向。

4.1分离生物医学信号中干扰或噪声

医学信号中常用的脑电信号是利用放置在头皮不同位置的导联纪录的一组数据,极易受一些干扰成分的影响,如眼球运动伪迹、眨眼、心电伪迹和工频干扰,这些干扰成分会对脑电信号的分析处理产生很多不良的影响。作为研究和临床使用的EEG信号,如何在有非自然信号污染的EEG信号中提取神经元基本特征是研究人员面临的问题[9,10]。文献[11]将小波分析和ICA相结合,用小波软门限法提高脑电的信噪比,再利用ICA分离出源信号,有效地去除了脑电中的噪声和心电干扰。应用ICA分离这些信号和噪声的根据是:脑活动与其他信号(如眼电、心电等)是不同的生理过程,即它们相互之间是统计独立的,符合ICA模型的假设条件。在噪声干扰确定并可人为生成(如脑电中的工频干扰)时[12],或干扰具有明确生理意义时,即干扰信号和有用生理信号可被看作是由相对独立的不同的源产生的情况下,可将噪声或干扰分离成独立的源信号。我们利用MATLAB进行如下试验:图3为3路同步测量的脑电和眼动信号,从原信号及其功率谱可见,脑电信号中含有眼动干扰和60Hz的工频干扰。由于脑电数据库没有提供同步测量的工频信号,我们构造两个60Hz工频干扰源P1=sin(2*pi*60*t);P2=cos(2*pi*60*t),与3路源信号构成5路信号,然后采用FastICA算法分离这5路信号。将分离后的眼电、工频干扰信号置零后,再重构源信号。图4为不含眼动和工频干扰的脑电信号,从重构结果及其频谱可见,脑电信号在100点和700点附近的眼动干扰明显消除,60Hz的工频干扰也得到了很好的抑制,试验取得了良好效果。

4.2特征提取

在生物医学信号和图像处理中,常需要提取信号的状态特征,作为诊断和识别的依据,通常提取特征都是基于信号的低阶统计特性,而ICA充分利用了信号的高阶相关性,能有效的提取信号在生理意义上的本质特征,分离出与待分析信号相对稳定的独立分量模式,进而可以用作信号的特征提取或分类[13,6]。郭晓静,等[13]分析处理不同心理作业的思维脑电信号,初步发现了与心理作业相对应的脑电独立分量的特征,并用于心理作业的分类,为脑机接口技术提供了新的方法。

5问题与展望

由于生物医学信号大多是多个神经元共同活动的结果,在源个数大于传感器个数时,如何分离源信号是值得研究的课题;并且生理信号总是含有各种噪声,如何在噪声环境下分离出源信号,即开展noisyICA研究,也是值得研究的课题;而且,生物医学信号的采集通道在很多情况下并不是线性瞬时的,如何处理非线性卷积信号的盲源分离,也有很重要的意义。在解决实际问题时,通常应用几种不同的ICA方法,获取不同的独立分量,并从中选取最符合实际生理或物理意义的一组。作为在盲信源分离(BSS)基础上发展起来的多元统计分析方法,ICA在生物医学信号处理、图像处理、天线阵列、控制等领域得到了广泛应用,其研究热潮方兴未艾,许多问题有待研究和解决。

独立分量分析的作用范文

精品推荐

扩展阅读