论文发表 | 论文范文 | 公文范文
最新公告:目前,本站已经取得了出版物经营许可证 、音像制品许可证,协助杂志社进行初步审稿、征稿工作。咨询:400-675-1600
您现在的位置: 新晨范文网 >> 工业论文 >> 数据挖掘论文 >> 正文

浅谈数据挖掘中定量式层次分析法

定制服务

定制原创材料,由写作老师24小时内创作完成,仅供客户你一人参考学习,无后顾之忧。

发表论文

根据客户的需要,将论文发表在指定类别的期刊,只收50%定金,确定发表通过后再付余款。

加入会员

申请成为本站会员,可以享受经理回访等更17项优惠服务,更可以固定你喜欢的写作老师。

摘要:层次分析法是解决主观决策问题的量化过程,决策过程依赖于判断矩阵的建立,而传统层次分析法的矩阵元素赋值完全依赖于制定者的主观经验与判断,容易导致主观因素对决策结果的偏颇。本文在传统层次分析法的理论基础上,讲判断矩阵的元素赋值与数据挖掘技术相结合,使用决策树分类算法来得到各决策方案对决策目标的信息增益率来进行判断矩阵的构建。从而摒弃决策过程中主观因素对结果的影响,完全依赖数据说话,提高决策的准确性。

关键词:决策;数据挖掘;层次分析法;定量分析

1引言

美国运筹学家A.L.Saaty提出的层次分析法是对一些较为复杂和模糊的问题做出决策的分析方法,将决策过程转化为目标、准则、方案等层次实现。层次分析法的目的是使复杂的决策过程条理化,而决策目标的可行性最终依赖于判断矩阵的建立。传统的判断矩阵元素的取值是通过主观设定的,依赖于制定者的个人偏好与经验,这些主观因素容易导致决策过程的失误[1]。而大数据的广泛应用,为层次分析法的判断矩阵的元素取值提供了数据量化的可行性,使得判断矩阵的建立可以完全依赖数据说话,而非制定者的主观判断,从而摒弃人为干预的主观影响,提高决策过程的客观性与科学性。本文将以作者所在学校的教学评价数据为数据集,应用数据挖掘的分类法提炼教学评价目标与教学环节各因素之间的信息增益率作为层次分析法的判断矩阵元素取值依据,阐述基于数据挖掘的定量式层次分析法的可行性[2]。

2层次分析法

2.1什么是层次分析法

层次分析法(AnalyticHierarchyProcess,简称AHP)是一种定性与定量分析相结合的决策手段。它使用较少的定量信息把决策过程数学化,为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法[3]。层次分析法的主要思想是为复杂的决策问题建立多层次的分析模型:高层的目标层(决策目标)、中间的准则层(决策指标)和最低层的方案层(决策措施)。通过分析计算,得到低层相对于高层的重要性指标权重,从而构造决策的判断矩阵,来衡量决策过程的可行性。

2.2层次分析法的步骤

2.2.1明确决策目标,建立分级层次模型明确的决策目标,确定要解决的问题,并以此目标为最高层,判定达成该目标所采取的措施准则设置为中间层,解决目标问题的实施措施和方案设置为最底层,就建立了分级的层次结构模型,如图1所示。

2.2.2构建判断矩阵分级层次模型建立后,需要确定各层次因素间的权重,该权重为某层中任意两个因素对于上层因素的相对重要程度的比较。比较得到的权重组成的矩阵称为层次分析的判断矩阵[4]。依据决策准则,同层次的决策因素相对于上层决策目标的重要程度的比较值,以1~9作为判断值来确定权重,如表1所示:

2.2.3检验判断矩阵的一致性根据表1中的决策因素判定标度,由专家人员根据经验和主观判定打分来给出bij的值,这个环节中含有较强的主观因素。为了防止主观因素的偏差,就需要判断矩阵的一致性,Saaty研究得出,用一致性指标C.I.(ConsistencyIndex)来衡量判断矩阵的一致性,其中n是判断矩阵的阶数[3]。在上述判定公式中,C.I.值越大,代表偏离一致性的程度越大;C.I.的值越小,代表偏离一致性的程度越小。随机一致性比率C.R.是随机一致性指标C.I.与平均随机一致性指标R.I.之比。当C.R.<0.10时,则判断矩阵的一致性达到可接受范围;而C.R.≥0.10时,则判断矩阵的一致性不能达到要求,需要进一步的调整修正,直到修正至C.R.<0.10为止。

3基于大数据的层次分析法体系

通过对决策判定的层次分析法的决策过程的分析可以看出,层次分析法的目标就是使主观因素较多的决策过程量化操作。随着数据挖掘技术的兴起,依托数据来使决策过程全量化操作成为更好的决策手段。在传统层次分析法的第二阶段,即构建判断矩阵时,可以依托现有数据,利用数据挖掘中的决策树分类算法来得到各决策方案对决策目标的影响程度标度值的判定[5]。以笔者所在学院的多年教学评价数据为例,通过对本学院历年教学评价数据进行数据挖掘所得的众多评价指标的信息增益率作为衡量决策方案层各方案的权重指标,决策判断矩阵的构造通过信息增益率从高到低排序来决定矩阵元素的值。对各指标的信息增益率进行排序,可得:教学内容(B1)>教学方法(B2)>教学态度(B5)>教学效果(B3)>课外辅导(B4),按照决策因素的标度从高到低排列,依次取标度1~5来建立的一级指标的判断矩阵如图2所示。同理,得到二级评价指标的判断矩阵经计算,得到教学评价决策问题的随机一致性比率C.R.=0.015<0.10,完全满足C.R.<0.10的条件。综上所述,以数据挖掘的分类信息增益率来替代人工主观判断设定而建立的判断矩阵非常成功。

参考文献

[1]张炳江.层次分析法及其应用案例.北京:电子工业出版社,2014:1-3

[2]张慧明.产业集群政策对城镇化建设效果评价研究[硕士学位论文].燕山大学,秦皇岛,2012

[3]许宏.基于数据仓库的决策支持系统研究.南京:南京工业大学,2004

[4]李忻.数据挖掘在高校教学质量评价系统中的应用研究[硕士学位论文].华北电力大学,北京,2010

[5]张琳,陈燕,李桃迎,等.决策树分类算法研究.计算机工程,2011,37(13):66-67

作者:鞠慧 单位:福州大学至诚学院

浅谈数据挖掘中定量式层次分析法责任编辑:张雨    阅读:人次