美章网 资料文库 信息挖掘应用范文

信息挖掘应用范文

信息挖掘应用

2研究的主要方向

目前国内外信息挖掘的研究主要是以知识发现的任务描述、知识评价与知识呈现为主线,以基于各种理论的有效知识发现算法研究为中心,以及更加广泛的应用研究为主要特点。

结构化数据挖掘技术的研究较为成熟,主要集中在算法的适应性、扩展性和鲁棒性的研究上。围绕统计学方法的数据挖掘算法的研究一直受到关注,用于在具有先验知识的情况下的不确定知识发现。关联规则知识发现算法是众多的应用研究的基础,研究工作集中在算法的改造以及可扩展性和普适性的研究上。序贯模式是R.Agrawal提出的重要的数据挖掘方法。包括单一的概念层次,多概念层次的序贯模式的研究。在不同的概念层次发现序贯模式是十分有价值的。

神经网络是目前常用的数据挖掘技术,广泛应用于分类、聚类、预测建模和混沌模式的知识发现。基于概念格理论的知识发现的理论研究和应用近年来受到重视。复杂类型数据的知识发现是目前国内外知识发现领域的研究热点。空间数据是指同占有一定空间的对象的相关联的数据。空间数据挖掘方法主要包括空间分类和空间趋势分析。

文本挖掘用于基于文本信息的知识发现。文本挖掘是利用智能算法,并结合文字处理技术,分析大量的非结构化文本源,抽取或标记关键字概念,文字间的关系,获取有用的知识和信息。其关键在于文本内容的量化表征。多媒体数据的知识发现的研究主要是特征的抽取。在音频数据挖掘中Fourie变换等用于抽取不变性特征。相应的知识发现方法包括学习矢量量化和多层感知器等神经网络方法。

信息挖掘的理论研究表现出多学科的交叉和多种技术方法的融合及信息挖掘的泛化和统一的特征。知识发现技术逐渐渗透到复杂非线性系统,如社会科学、生物信息科学、商业与金融领域、地震和气象学等领域的信息处理之中。复杂性系统的信息过程表现出显著的非线性动力学特征。

3信息挖掘是商业信息处理技术的关键

商业领域中的海量历史数据与实时数据和广泛的应用需求为信息挖掘的应用和发展提供了一个广阔的空间。信息挖掘与已有信息系统和人工智能技术相结合,为商业与金融数据的分析处理提供了重要的工具和理论方法。这些理论和工具已经被用于解决金融与商业领域的以下各类问题:信用等级的评估;金融和经济预测;证券价格变动的预测;破产和银行倒闭预测;恶性透支和商业欺诈甄别;证券的投资选择和分类;商业行为分析以及销售与客户关系分析等。

在金融与商业领域中,信息挖掘技术的应用表现为范围上的延拓和层次上的深化以及多种技术方法的整合。利用文本挖掘,可以从Internet上的成千上万的与金融相关的Web网页中获取全球金融市场的实时数据、与金融市场相关的市场、宏观经济环境、政策和法规等消息、进行金融分析报告等。利用数据挖掘技术对分布于全球的市场消息和信息的处理来预测全球市场的主要股票指数,并对全球主要外汇交易市场货币交易率的未来走势进行预测和决策分析。

从细微和难懂的数据中识别、发现和抽取各类知识和规律。这样的商业分析每天都在发生:营销管理人员需要为某种产品进行目标市场分析;同时他们要求知道购买竞争对手产品的客户规模、潜在客户对优惠券的相对接受能力、竞争对手的产品在零售商店中陈设的位置、下一个商业周期中对自己的及竞争对手的产品需求预测,等等。基于信息挖掘的商业与金融信息处理技术的价值在于能够为使用者提供从数据集合中发现新关系的能力。极大地加强战术和战略决策以及决策过程的精确性。

信息挖掘这一概念起源于知识发现(KDD)领域,广泛地应用到科学研究、金融、保险、医疗保健、司法和制造等各个行业。各个学科领域都从不同的角度利用相应的理论和分析方法进行着信息挖掘的研究工作,涉及到机器学习、统计分析、数据库技术、模式识别、人工智能、神经网络、可视化方法、不确定性推理、人工生命、模糊逻辑和粗糙集理论等领域。

信息挖掘的应用对象从结构化数据发展到半结构化及非结构化的复杂数据类型,包括关系数据库、面向对象数据库、空间数据库、推理数据库、多媒体数据库、时态数据库、文本数据、Web日志文件、图形图像数据及音频和视频数据等。信息挖掘所涉及到的知识类型,根据应用特点可分为预测型、描述型、发现型、验证型等类型知识,根据知识的性质特点可分为关联规则、分类规则、聚类规则、时序模式、相似模式、混沌模式、回归模式、趋势分析、偏差分析、模式分析等。