美章网 资料文库 LMBP神经网络分类识别范文

LMBP神经网络分类识别范文

LMBP神经网络分类识别

1材料与仪器

1.1样品来源12批穿心莲药材样品由广东省中药研究所提供,经广州华南植物研究所陈炳辉研究员鉴定为穿心莲Andrographispaniculata(Burm.f.)Nees,其中4批产自江西,5批来自广东,福建3批。

1.2试剂乙腈(色谱纯),甲酸(分析纯),二次蒸馏水(自制)。

1.3仪器Agilent四元泵高效液相色谱仪、SPD210A紫外检测器,LC210ATVP输液泵、UV24802型紫外可见分光光度计,AR2140电子分析天平。

2方法

2.1色谱分析条件PhenomsilODS柱(250mm×4.6mm,5μm),0.1%甲酸乙腈(A)与0.2%甲酸(B)梯度洗脱:0~20min(20%A-80%B),20~40min(30%A-70%B),40~55min(40%A-60%B),55~60min(85%A-15%B)。流速1.0ml/min,柱温25。C,检测波长254nm,进样量10μl,所有组分均在60min内被洗脱。

2.2对照品溶液的制备精密称取穿心莲内酯、脱水穿心莲内酯、新穿心莲内酯和脱氧穿心莲内酯对照品适量,用50%甲醇配制成1.0mg/ml的对照品溶液。

2.3供试品溶液的制备取各批干燥的穿心莲药材2.0g,粉碎,过40目,用20ml85%的乙醇回流提取两次,2h/次,过滤,合并滤液,回收乙醇,滤液浓缩至干,再加50%甲醇使其充分溶解,置10ml量瓶中稀释至刻度,作为供试品溶液。

2.4方法学考察

2.4.1精密度实验取供试品溶液(样品1),连续进样6次,各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明仪器精密度良好。

2.4.2稳定性实验取供试品溶液(样品1)分别在0,1,2,4,12,24h进样测定,各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明样品在24h内稳定。

2.4.3重复性实验取穿心莲药材(样品1),按“2.3”项下的方法分别制备供试品溶液6份,进样检测,结果各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明方法的重复性良好。

2.5模式识别方法

2.5.1模式识别和BP神经网络模式识别作为一个研究领域,迅速发展于20世纪60年代,它是一门以应用数学为理论基础,利用计算机应用技术,解决实际分类及识别问题的学问[2]。

神经网络是一种模拟人脑功能的成熟的模式识别方法,它借鉴了人脑神经系统处理信息的过程,以数学网络拓扑结构为理论基础,其中BP神经网络是迄今为止应用最为广泛的神经网络[3]。

BP神经网络是一种有监督的学习算法,它的特点是同一层内的神经元不连接,在整个信号传递过程中不存在任何信号反馈;输入层用于信号分配和传递,不具备运算功能;隐含层和输出层的神经元具有运算功能,可输出最终运算结果。BP神经网络的学习过程有正向与反向两个过程,在正向传播过程中,输入信息从输入层经过隐含层传向输出层,若不能得到预期输出,则转为反向传播,将信号沿原来的连接通道返回并修改各层节点间的权值,经过反复调试,使得误差信号小于某个阈值或等于0,此时训练结束。经过训练的网络则可将系统规则、预测能力等隐含在网络中,只需将测试样本输入则可给出处理结果。

2.5.2Levenberg-Marquardt算法改进的BP算法BP神经网络的常规算法在实际应用还存在一些需要改进的问题,例如网络学习收敛速度慢,容易陷入局部极小等。而L-M算法是专门用于误差平方和最小化的方法,它在网络训练速度和识别精度上的具有明显的优势[4],因此本研究采用L-M算法对标准的BP算法进行改进。

设BP神经网络的误差指标函数为:

E(x)=12¶Ni=1‖Yi-Y^i‖2=12¶Ni=1e2i(x)

其中,Yi为实际输出向量,Y^i为预期的输出向量,ei(x)为误差。

设xk表示第k次迭代的权值和阈值组成的向量,新的权值和阈值组成的向量xk+1表示为:

xk+1=xk+△x,△x=[JT(x)J(x)=μI]-1J(x)e(x)

其中,J(x)为网络训练误差e(x)的Jacobian矩阵,I为单位矩阵,μ>0。

L-M算法的流程:①给出训练误差允许值ε,常数β和μ0,初始化权值和阈值向量k=0,μ=μ0。②计算网络输出及误差指标函数E(xk)。③计算Jacobian矩阵J(x)。④计算△x。⑤如果E(xk)<¶,则转到⑥,否则以xk+1=xk+△x为权值和阈值向量计算误差指标函数E(xk+1),若E(xk+1)<E(xk),则令k=k+1,μ=μ/β,转到②;否则令μ=μβ,转到④。⑥结束。

当μ=0时,L-M算法即高斯-牛顿法,当μ取值很大时,则越接近梯度下降法。在实践中,它具有二阶收敛速度,所需要的迭代次数很少,既具备牛顿法的局部收敛特性,又有梯度下降算法的全局特性。因此,L-M算法提供了一种快速有效的训练手段,其算法计算复杂度为O(n3/6)。

2.6指纹图谱的建立和分析

2.6.1穿心莲的指纹图谱按照上述方法,分别对12批穿心莲药材进行分析,制作了穿心莲药材的HPLC指纹图谱,并计算出其穿心莲内酯、脱水穿心莲内酯、新穿心莲内酯和脱氧穿心莲内酯的含量。

2.6.2资料预处理为消除由于数据变换的幅度和范围以及数据分布的非正态性对结果的影响,先将原始数据进行标准化变换。

2.6.3LM-BP神经网络结构及训练测试结果本实验所采用的3层LM-BP网络中,输入节点数为4,即原始数据经特征提取后的4个主成分,隐含层节点数为4,输出层有1个节点。由于目前仍无系统的关于中间隐层节点数的选取理论,经多次实验比较,最终选取隐层节点数为4时效果比较显著。

动量因子和学习速率是影响BP神经网络训练速率和收敛度的两个重要因素。如果学习效率和动量因子过大则网络收敛很快,但最后网络发生振荡,失去功能;如果学习效率和动量因子太小则学习速度太慢,网络性能也会受到影响。因此经实验比较选择,本网络的最佳学习率为0.05,动量因子为0.6。

由于实验的样品数目较少,故采用交叉验证法进行分类验证,也就是说将标准化变换后的每个样本依次作为待测样本,用剩余的其它样本组成新的训练集建立学习模型,用于预测每个样本的归属。

经过LM-BP神经网络的训练,可发现有一个穿心莲样品被识别错误,这份来自江西的样品被鉴别为福建的样品,其他11个样品的鉴别结果均正确。从总体来看,使用LM-BP网络鉴别穿心莲样品的识别正确率达到了91.67%。