美章网 资料文库 遗传算法对数据挖掘的价值范文

遗传算法对数据挖掘的价值范文

时间:2022-12-25 10:00:05

遗传算法对数据挖掘的价值

遗传算法是当前我们应用在数据挖掘当中的主要算法,它作为对全局并行进行优化的一种有效方法,在计算机的众多领域都有广泛的应用,特别是与云计算相关的一些领域,因此如何在数据挖掘中去有效地应用优化后的遗传算法也是现在研究的一个重要趋势。

1遗传算法在数据挖掘中的应用

在目前数据挖掘的研究中,在分类器、决策树、关联规则方面应用改进后的遗传算法我们是涉及得比较多的。其中具有随机、非线性、混沌等特点的实际问题又是我们用改进后的遗传算法解决的主要方面,解决了一部分通过其他学科很难描述的问题,并提供了相应的一些数据模型,为通过其它技术来解决问题提供了很好的基础。对于在应用中出现的与现实情况相关的各种嘈杂无序的数据,改进后的遗传算法能够比较有效地去解决这个问题。通过将实际遇到问题的具体化,我们都可以把他们变为计算机中的搜索问题,相关的数据库看做搜索空间,然后利用改进后遗传算法模拟自然进化算法的特点,在大量的数据规则中去完成搜索,得到我们真正需要的数据。下面我们来看一下遗传算法在物流上的应用。

2遗传算法在数据挖掘中的应用实例

现有某物流中心在全国分散在各城市的物流子中心S(1)、S(2)、……、S(n),某次公司准备做宣传,又想节约成本,故准备用一台宣传车选择一条最短的路线在各个城市的物流中心作相应的宣传各一次,然后回到起点。那么我们通过改进后的遗传算法我们要如何规划相应的路线呢?在大部分情况中,我们会把遗传算法的运行分为两个阶段,它从目前生成的群体开始,然后通过一系列优胜劣汰的选择后生成过渡群体,最后在过渡群体上进行重组与变异从而形成下一代新的群体。

2.1调整参数及设计编码第一代群体通过随机函数随机选择,从中选出1000个个体。我们这里采用最常用的染色体编码来对物流子中心进行编码,每一个子中心作为一个基因,子中心的个数就是基因数。子中心的编码在这里我们采用十进制来编码,我们使用n个数码来表示n个子中心,我们会专门定义一个数码-子中心对应表,保证各个数码之间不会出现不确定性,保证在算法计算过程中不会出现二义性。在这个算法的应用里面最重要的就是确定路径的编码,制定的一条路径(a)i就是由n个数码连成的,每一个数码对应为染色体中的一个基因,整个编码串对应一个染色体,通过相应对应表的指标保证在每一个染色体中每个基因只出现一次。

2.2适应度及适应度函数在遗传算法中,适应度用来评价染色体个体的优劣程度,优胜劣汰,一般是适应度越大个体就越适合,反之也是一样,所以遗传算法根据适应度大小对染色体或个体来进行最优选择,以保证把机会留给最优秀的个体来繁殖后代,遗传最好的基因。与之对应我们在设置适应度函数时,函数值必须保证是非负数,在许多实际问题中,求解的目标通常是费用最小,而不是效益最大,因此需要将求最小的目标根据适应度函数非负原则转换为求最大目标的形式。结合我们这儿的实际情况,就是需要将求最短路径结合适应度函数非负原则转换为求最优解的过程。因此在这里,我们设问题的目标函数为len(a),问题的目标是求取最小路径,结合适应度函数非负原则,这就是最小值优化问题,我们可以取适应度函数F(O)为路线a所对应的路线长度len(a)的倒数。

2.3遗传因子的确定遗传变异分为基因重组(交叉)与基因突变,应该说这两个步骤就是使到子代不同于父代的根本原因。对于这两种遗传操作,二进制编码和浮点型编码在处理上有很大的差异,其中二进制编码的遗传操作过程,比较类似于自然界里优胜劣汰的过程。在这里我们根据适应度函数选择交叉的父代生成子代,采用循环交叉以保证每个物流子中心在每条路径中只出现一次。同时在染色体的基因突变中我们选择倒位变异的方法来解决问题。

2.4终止条件一般来说,适应度越大,相对的解越优,判断是否已得到近似全局最优解的方法就是遗传算法的终止条件,其相对应的就是最短路径。一般在最大迭代次数范围内可以选择下列条件之一作为终止条件:最大适应度值和平均适应度值变化不大、趋于稳定;相邻SGA代种群的距离小于可接受值。这里我们选择迭代次数为600。

3结语

数据挖掘技术集数理理论、数据挖掘理论、专家系统、人工智能、神经网络、图形图象设计等多门学科于一身,其发展速度必将大大影响全球信息化的进程,对其进行系统、深入、全面、详尽的研究是信息化发展的客观需要。如何从大型数据库中提取人们感兴趣的知识是数据挖掘的一个重要方面。遗传算法是数据挖掘中主要的算法之一,它在数据挖掘方面的应用也得到了极大的重视。遗传算法应用于决策树、分类器和模糊规则的获取等方面的文献不断涌现,遗传算法己是数据挖掘领域的一个重要研究课题。遗传算法模拟自然进化的通用全局搜索算法,避免了搜索过程中的局部最优解,用在规则发现方面有希望发现真正有用的规则。

作者:陈晶晶 单位:湖北经济学院法商学院

被举报文档标题:遗传算法对数据挖掘的价值

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/gylw/sjwjlw/684611.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)