论文发表 | 论文范文 | 公文范文
最新公告:目前,本站已经取得了出版物经营许可证 、音像制品许可证,协助杂志社进行初步审稿、征稿工作。咨询:400-675-1600
您现在的位置: 新晨范文网 >> 工业论文 >> 数据挖掘论文 >> 正文

数据挖掘技术对商业银行的影响

定制服务

定制原创材料,由写作老师24小时内创作完成,仅供客户你一人参考学习,无后顾之忧。

发表论文

根据客户的需要,将论文发表在指定类别的期刊,只收50%定金,确定发表通过后再付余款。

加入会员

申请成为本站会员,可以享受经理回访等更17项优惠服务,更可以固定你喜欢的写作老师。

摘要:

数据挖掘技术作为一种先进的数据处理技术,其可用性已在国际上得到了广泛认可,对提升商业银行竞争力具有重要意义。本文在阐述数据挖掘技术的概念、应用步骤以及技术算法的基础上,有针对性地分析了数据挖掘技术在商业银行中的具体应用,为商业银行有效应用数据挖掘技术提供可行性参考。

关键词:

数据挖掘;应用步骤;算法;商业银行

一、引言

20世纪80年代开始,我国商业银行历经单机应用、县域微机联网、城市集中、省域集中、全国数据集中等阶段,建成了能够提供7×24小时不间断服务并覆盖城乡的庞大信息系统,基本实现信息化。20世纪90年代,网上银行的出现开启了我国商业银行的渠道转型之路,交易替代率成为衡量银行信息化水平的重要指标。据艾瑞咨询集团统计,2009年到2013年,我国商业银行的电子银行交易替代率逐年快速攀升,2014年增速有所放缓,并且预计未来几年将维持较低增速,如图1所示。电子银行交易替代率增速的放缓,意味着我国商业银行信息化建设进入新阶段——“信息化银行”。作为银行信息化进程更高级的表现,信息化银行通过对信息(即数据)的集中、整合、共享、挖掘,使银行的客户服务、经营决策、战略制定发生质的变化。在信息化高速发展的背景下,各银行积累了海量的数据,并于近几年建立起了专用于业务经营分析的数据仓库。视数据为重要资产的理念已在我国银行业形成共识。当前,我国商业银行之间竞争激烈,信息处理是其中重要的一环。数据之所以被视为重要资产,关键在于其基于数据分析和挖掘的业务洞察力将成为大数据时代商业银行的核心竞争力,直接影响商业银行的竞争水平。如何有效利用这一重要资产以达到提升自身核心竞争力和促进管理的目的,是目前大多数商业银行在大数据时代所面临的重要挑战之一。因此,数据挖掘作为一种数据处理及应用技术,在现今数据量庞大的银行业中受到了前所未有的重视。

二、数据挖掘技术

(一)数据挖掘技术概述基于数据的洞察力,即数据挖掘技术。数据挖掘,又称为资料探勘、数据采矿,一般是指从大量的、不完整的、模糊的数据中,利用各种算法搜索出隐藏在这些数据中有着特定或者特殊关系信息的过程,通过预测数据关系和搭建模型找到潜在的数据关系。数据挖掘技术的产生,原因在于信息技术飞速发展,储存在各门各类系统中的数据呈几何级数激增,导致数据虽极为丰富,但传达出来的信息却相对匮乏,造成信息价值的巨大浪费。在应用数据挖掘技术之前,需要先了解这项技术的应用步骤和技术算法。

(二)数据挖掘技术应用步骤数据挖掘是一个反复循环的过程,如果每一个步骤没有达到预期目标,则需要回到前面的步骤,重新调整并执行。数据挖掘过程可分为6个步骤,具体如图2所示。1.数据收集。根据确定的数据分析对象,收集初步的数据,包括数据描述、数据探索和数据质量验证等,将收集到的数据存入数据库。2.数据准备。存储于数据库中的数据经过长期积累形成海量数据,其中存在一些冗余数据、噪音数据以及不完整数据,因此需要先进行数据准备工作(主要包括数据的选择、净化、推测、转换、缩减等),将这些原始数据构造成最终适合建模工具处理的数据集。此步骤具有反复循环特性,目的在于把各种不同来源的数据加以清理、整理和归并,以配合不同建模技术的使用。3.建立模型。根据数据准备工作后所得到的数据集,选择合适的建模技术分析数据,形成知识的模式模型。需注意的是,同一个问题有多种可供选择的分析技术,而不同技术对数据要求各有不同,因此需要回到数据准备阶段,重新转换数据直至格式符合要求。4.模型评估。模型评估是对第3步骤所得到的模式模型进行评估,确定这些模式模型是否具有实用价值,是否准确反映数据的真实意义等。在评估过程中,还须注意检查构建模型的每个步骤,同时对知识做一致性检查,解决与以前得到的知识相互冲突、矛盾的地方,直至符合规范。5.模型部署。模型的成功创建,目的是为了应用到实际领域中,因此模型部署也是数据挖掘的步骤之一。模型部署有两种方法:一种是将数据挖掘所得到的分析信息以可视化的方式呈现给用户;另一种是作为新知识存放在知识库中,以供其他应用程序使用,而由此可能产生的新问题则需要对知识做进一步的优化。6.数据再收集。作为新知识存放在知识库中的数据模型,在为其他应用程序提供支持的过程中会发现更多的问题,产生新需求,由此开始新一轮数据的收集。

(三)数据挖掘技术算法算法是数据挖掘技术的核心,不同算法产生的数据挖掘效果不尽相同,较具代表性的算法主要包括分类、聚类、关联规则、孤立点检测等。1.分类。分类分析是数据挖掘中的一个重要课题,通过查找数据对象之间的共同点将数据分类,然后对数据进行建模,从而将数据库中的数据映射到某个具体的类中,可用于提取描述重要数据类的模型或预测数据未来的趋势。分类算法在银行的应用中较为常见,如分类识别客户,并对其进行特色服务等。2.聚类。聚类分析是指将抽象对象的集合按照相似性和差异性分成由类似的对象组成的多个类。每个类是一组数据对象的集合,这些对象与同一类中的对象彼此相似,与其他类中的对象相异。3.关联规则。数据库中存在一类重要数据,这些数据之间存在某种规律性,关联规则分析的目的就是为了找出这种隐藏于数据库的关联网。4.孤立点检测孤立点检测分析法是数据挖掘中的关键环节。在海量庞杂的数据库中经常会发现一些“异类”数据,一般称之为孤立点。这些孤立点的存在并非毫无意义,相反,它们在实际应用中可能有着超乎寻常的重要意义,如在信用卡诈骗的侦查过程中,这些孤立点往往成为关键线索。

三、数据挖掘技术在商业银行中的应用

在信息化高速发展的背景下,各商业银行积累了海量的、庞杂的数据,在应用专业的数据处理技术上占有长足优势。同时又由于银行产品具有相当的同质性,因此银行间的竞争要点往往体现在谁准确掌握了客户关系以及海量的业务和客户信息背后的业务规律,谁就可以更科学地进行决策,提高竞争力。进入信息化银行阶段的商业银行,在当前及今后一段时间内面临着利率市场化加速推进、互联网金融全面成长、现代信息技术急速发展三大挑战。如何化挑战为机遇,推进战略转型,最关键、最迫切的一项战略抉择就是大力推进大数据技术发展,扩大专业数据处理技术的应用。数据挖掘技术作为一门专业的数据处理技术,能有效提升商业银行的数据处理能力和竞争力,目前被广泛应用于风险评估与控制、客户关系管理、竞争情报系统建设和金融监管等领域。

(一)风险评估与控制风险管理是商业银行日常运行中首屈一指的重要事项,加强对各种风险的评估是商业银行实现长远发展的必然选择。目前大多数银行采用数据挖掘技术来科学评估各自银行中所存在的风险。在对商业银行风险进行科学评估中,数据挖掘技术主要通过最终异常点来实现,常用算法包括遗传算法、粗糙集、模糊理论等。信用风险是商业银行面临的风险中最为典型也是最为严重的风险,主要指的是信用卡诈骗、贷款无法收回、恶意透支等风险。因此,数据挖掘在银行业的主要应用之一是对贷款方进行信用风险评估,一般通过构建一定的信用评级模型,如神经网络模型、FICO评估模型以及贝叶斯分析模型等来对贷款方进行风险评估。另一方面,以直观量化的信用评分方式评估其银行账户信用,按照数据挖掘模型确定的权重给每项申请按指标打分,累计得到该申请人的实际信用评分情况。最后,银行根据信用评分结果决定是否通过申请人的申请,以及确定信用额度。

(二)客户关系管理数据挖掘在银行业的另一主要应用是客户关系管理。客户关系管理是商业银行的重要环节,主要是指在最佳时间、以最合理价格向客户提供最优质服务的行为,由此可见高水平的客户关系管理对任何一家银行的重要意义。高水平的客户关系管理实际上是大众营销向一对一营销的转变,因此需要对各种信息资源进行高效梳理、有效整合,反映到数据挖掘在客户关系管理中的具体应用是分类识别、提高客户忠诚度和实现交叉销售。一是利用分类法识别优质客户。可通过自动探测聚类的数据挖掘方法,找出客户数据库中的特征,自动分类识别客户,通过对客户的服务收入、风险、成本等相关因素的分析、预测和优化,找到新的可赢利目标客户。二是利用决策树算法开展特色服务。通过运用决策树模型,对客户贡献的期望值进行计算并将客户分类,根据客户期望值的不同进行分组,再依据不同类型客户的特点提供具有针对性的特色服务,提高客户忠诚度。决策树是利用树状结构来体现影响数据变量的分析预测模型,顾名思义就是用来做决定的树,由决策点、状态节点、结果节点3部分组成。其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别,如图3所示。一个分支就是一个决策过程,每个决策过程涉及且只涉及一个数据的属性,通过自上到下或自左向右的回归方式合理计算每棵树的期望值,从而得到最优解。决策树算法的优点是易于理解和实现,在较短时间内能够对大型数据源获取可行且效果良好的结果。三是利用关联分析进行交叉销售。我国商业银行的经营环境日益复杂,交叉销售成为商业银行应对挑战的新渠道,而实现交叉销售离不开数据挖掘技术中的关联性分析。数据库中存在的一类重要的可被发现的知识通常被称为数据关联,而关联性分析的目的就是为了找出数据库中隐藏的关联网,从而找到当前客户中相似的可能转移者,再通过孤立点分析法发现客户的异常行为,使银行避免不必要的客户流失。

(三)竞争情报系统建设中国素有“知己知彼,百战不殆”的说法,足见建立竞争情报系统、掌握竞争对手情况的重要性,这种重要性在日趋激烈的商业银行竞争中得到更多凸显。要想在激烈的市场竞争中抢占先机,除了要对竞争对手、竞争环境有一个清晰的掌握外,还要在此基础上合法收集、选择、整理和分析所得到的信息,为自身战略决策的制定提供参考和借鉴。鉴于商业银行在日常经营活动中累积了大量庞杂的内外部数据,其中很多数据难以通过单一的表格展现出来,大多以文本或报告的形式出现。因此,数据挖掘技术在商业银行的竞争情报系统建设上,采用的是关联分析技术,能从各种各样的文本和报告中找到关键字展开关联分析,从而发现各种数据之间的隐含关系,由此对竞争对手形成全面系统的认识。我国金融改革已进入深水区,金融环境的转变、竞争主体的多元化、信息技术的高速发展对商业银行而言是挑战,更是机遇。利用数据挖掘技术及时深入地了解竞争对手的实际情况,已成为商业银行实现自身长远发展的必然举措。

(四)金融监管我国金融活动发展到当下阶段,金融环境渐趋开放包容、市场竞争主体多元、金融业务产品和服务模式不断创新,更加需要强有力的金融监管保证金融市场的正常稳定运行,有效防范市场风险的滋生。数据挖掘在金融监管领域的应用主要体现在反洗钱上,孤立点分析、序列模式挖掘、分类研究、聚类分析等数据挖掘技术在反洗钱的应用上得到充分发挥,帮助金融机构有效监测一切洗钱行为。具体做法是:将多个数据库(以银行交易数据库、司法部门的犯罪历史数据库为主)的信息进行集成,归纳总结洗钱活动的特征和规律,与存在洗钱嫌疑的交易活动相对照,判断是否属于洗钱交易,一旦属实,数据挖掘可进一步追踪到异常资金的去向,协助有关部门侦破洗钱犯罪案件。

四、结语

实践证明,数据挖掘技术作为先进的数据处理技术,在国际金融行业的应用上得到了广泛认可,具有降低成本、规避风险、提高工作效率、提高核心竞争力等优点。随着我国市场经济体制改革和金融改革的不断深入,我国商业银行在这种大背景下面临着内外多重挑战,加强数据挖掘技术的研究与应用已经成为商业银行面临激烈竞争时能否脱颖而出的重要因素。

参考文献:

[1]霍魁.大数据时代下数据挖掘技术在银行中的应用[J].商,2015(26):191-192.

[2]R.格罗思.数据挖掘——构筑企业竞争优势[M].西安:西安交通大学出版社,2008.

[3]安春云,张东彦,李雅洁.大数据时代的信息化银行建设[J].河北金融,2014(3):38-39.

作者:麻文奇 单位:广州银行电子结算中心

数据挖掘技术对商业银行的影响责任编辑:杨雪    阅读:人次