您现在的位置: 新晨范文网 >> 工业论文 >> 数据挖掘论文 >> 正文

浅谈可视化数据挖掘技术

2019/11/27 阅读:

摘要:数据挖掘是现今的热门技术,结合了人工智能、机器学习以及统计学相关知识,具有广阔的应用发展前景。在本文中,将就可视化数据挖掘技术仅限于一定的研究。

关键词:可视化;数据挖掘技术

一、引言

近年来,我国的数据挖掘技术不断发展,并在多个领域如金融、电信、医疗当中具有了应用。而在新的发展形势中,如何使人对数据挖掘技术进行快速掌握,在海量数据中发现隐藏的知识、信息,则成为了该技术具体应用当中的关键指标。对于可视化数据挖掘技术来说,即是将数据挖掘同可视化技术进行了结合应用,以直观图形的方式对数据发展趋势与关联情况进行呈现,为具体工作的开展提供重要的数据信息。

二、技术分类

对于数据可视化挖掘技术来说,其在应用中融合可视化与数据挖掘技术,同时使用自然的交互界面,促进用户能够进行良好的参与。同时,以领域知识为基础实现对挖掘过程的推进,在理解挖掘结果的同时做好反馈评估处理,以此获得更高的挖掘时效性。

1.数据挖掘可视化对于数据挖掘过程的可视化来说,即通过可视化图形的应用表达挖掘过程。通过对图形的观察,即能够了解到数据挖掘过程、数据源与结果。对于一个好的数据挖掘算法来说,通常只在部分领域中应用,而不会在其余领域中应用。通过可视分析以及人机交互技术的应用,即能够在挖掘当中对中间输出信息进行展现,帮助用户在对算法运行过程及时观察的基础上进行动态调整。在用户参与中,将对单纯使用设备的自动挖掘缺点进行了避免,帮助用户更好的理解挖掘结果。

2.数据可视化在该方面,即是从不同抽象层次、通过不同类型的可视形态将数据库当中的多维数据实现对用户的展示,帮助用户能够对数据进行近距离浏览,并在抽象层次上对不同数据间隐藏的趋势与关联进行分析。

3.结果模型可视化在该内容中,以可视化方式呈现挖掘结果,包括有散点图、雷达图、折线图等实现对决策树、树以及孤立点的标示。可视化结果的存在,能够帮助用户对数据挖掘当中的知识进行更好的理解,发现其中隐藏的走势、关系与模式。同时,也可以根据可视形态展示效果对特征参数动态调整,以此对新的规律与模式进行发现。

三、数据可视化技术

1.可视化要素在数据可视化当中,其组成部分有人机交互技术与可视化方式等。其中,可视化数据的类型有很多,如一维、二维与多维数据等,在数据类型上也具有复杂的特点,包括有网状数据与层次数据等。其中,层次数据具有可视化特点,能够以网络图的方式实现对网状数据的展示。软件方面,在算法理解上也具有积极的意义,能够为具体的软件开发活动打下良好的基础。

2.可视化内容根据数据类型的不同,可以对不同的数据可视化技术进行应用:第一,图表可视化。该技术为传统二维、三维可视化技术,如通过折线图对连续字段上离散值进行表示,应用圆饼图对总体中不同数据项具体份额进行展示;第二,几何投影技术。在该技术中,能够将多为数据通过投影形成低维数据,包括有平行坐标图、格架图以及散点矩阵技术等;第三,图标技术。该技术在应用中能够将多为数据实现对一个图标的映射,由不同图标对不同维度的数据侧面进行表示,包括有形状编码图以及枝形图等;第四,像素可视化技术。在该技术中,能够将不同数据实现对屏幕像素点的映射,同时在分离视图中对不同属性值进行显示。在技术在实际应用中具有较大的数据信息量,能够在对信息进行有效查看的情况下做好全局状况的把握;第五,层叠技术。在该技术中,能够以树形的方式表示多维数据空间,如锥形图、树图以及嵌套圆等。

四、可视化数据挖掘技术应用

1.预处理阶段在数据挖掘工作开展中,数据预处理是重要的环节,其主要流程有:第一,数据抽取。在该阶段中,将根据挖掘工作的具体质量要求与挖掘目标,选取数据集、连接数据源,其中包括有字段、表以及记录选择等;第二,集成。将多个数据源数据集存储在一处;第三,数据清洗。在该过程中,包括有缺省值处理、噪声点发现删除,同时对存在的数据冲突问题进行解决;第四,数据转换。包括有汇总计算、数据拼接以及格式转换等;第五,数据归约。在保证挖掘目标与质量的基础上,通过对数据集的压缩实现对挖掘效率的提升。

2.数据挖掘算法在该环节的可视化设计当中,其主要内容包括有:第一,由用户对初始条件进行挖掘,包括有设置参数以及数据及选择等。在该过程中,用户可以动态的挖掘采纳数值以及进行数据值调整;第二,中间结果显示部件。传递算法执行中操作步骤、输出数据给界面。根据算法的不同,将具有不同的结果输出,同时通过公共接口做好可视化处理。在最终的用户界面中,将对辅助信息以及中间过程数据进行展示;第三,算法界面映射。在该内容中,可以通过扩展语言DMX的应用封装数据挖掘算法。

3.挖掘结果模型描述方面,使用PMML对数据挖掘结果模型进行预测,该模型的应用思想,即通过XML数据项分离特征对数据挖掘模型的可移植性、描述以及标准化目标进行实现。结构方面,其包括有数据字典、转换字典、头文件以及数据挖掘模式等。同时还具有输出值、统计信息以及目标值等,根据具体挖掘算法的不同存在差异。可视化设计方面,挖掘结果模型可视化的实现,即是帮助用户对最终挖掘结果进行更为有效的理解,以此为基础给出恰当的反馈与评估。在该过程的可视化当中,即根据不同挖掘模型,以不同的方式进行呈现。从该角度而言,即需要能够对基于模型的用户界面进行设计,使用户能够对挖掘模型进行直接的分析。挖掘结果模型部件方面,主要包括有缩放部件、多视图显示部件以及可视化图形库这几部分。

五、结语

可视化数据挖掘技术的出现,为数据信息的挖掘收集提供了新的可能。在上文中,我们对可视化数据挖掘技术进行了一定的研究。在未来工作当中,还需要能够进一步做好该技术的研究优化,在不断提升技术应用范围、应用优势的基础上使其能够在数据工作当中发挥出更大的作用。

参考文献:

[1]张俊.可视化数据挖掘技术的研究与实现[J].重庆工商大学学报:自然科学版,2013(3).

[2]黄凤.可视化数据挖掘技术[J].电子技术与软件工程,2016(24).

[3]李华,张井玲,刘婷婷.大数据时代下数据挖掘技术的应用研究[J].现代信息科技,2019(13).

作者:孙健 单位:扬州高等职业技术学校

浅谈可视化数据挖掘技术

2019/11/27 阅读:

推荐度:

免费复制文章