美章网 资料文库 银行业知识图谱的应用范文

银行业知识图谱的应用范文

时间:2022-03-11 03:37:59

银行业知识图谱的应用

随着商业银行知识结构的日益丰富,知识体量的指数级增长,传统人工式的知识处理体系已不能满足现代商业银行将知识转化为智慧的智能化知识处理的需求。本研究针对商业银行当前面临的知识管理及应用问题,提出了基于知识谱图技术的集“RDIKW知识认知框架”“ESER知识图谱技术框架”“知识图谱管控框架”为一体的智能化知识管理体系,核心目的是通过知识工程实现知识传承与管理,将数据、文档、图像、音频和视频等多元异构的知识群转化成为业务服务的智慧,使知识成为商业银行的关键资产,为全行级智能知识库及智慧大脑的构建奠定坚实的人工智能基础,助力商业银行实现学习型银行、知识型员工、智慧型应用的目标。

一、商业银行知识管理领域面临的挑战

知识是智慧的基础原料,若要实现知识向智慧的转化,必须面对知识认知、知识管理和技术手段的挑战。

1.知识认知不足,知识范围不明在银行内外部,知识体量增长迅速,知识形式多种多样,知识联系愈加紧密,实现显性知识的定义和收集,以及隐形知识的有效挖掘,需要首先从知识认知入手。

2.管理方式繁杂,管理目的模糊一方面,商业银行组织内部之间或与集团公司之间业务协作需求频繁,知识流转困难。另一方面,大量专业性极强的宝贵业务经验往往人走“茶”凉,知识整合难度较大。因此,商业银行必须搞“活”银行内部知识资产,建立健全的管理制度,促使知识管理从分散、单一向集约化、多元化转型。

3.技术手段落后,智能水平较低传统商业银行对智能化知识管理研究普遍较晚,知识管理体系智能化水平较低,在知识管理的基础技术上实践不足。而随着知识图谱、云计算、大数据、人工智能等新技术的发展,构建统一智能的知识管理体系将不再是一个技术难题。

二、知识图谱是知识管理体系的基础技术

1.知识图谱是目前关系网络最有效的表示方式(1)发展趋势业界普遍认为,知识图谱是最接近真实世界的数据组织结构,它符合人的思维模式,能够将企业所有数据连接起来,新的数据种类也能快速融合并发挥作用,具备灵活应对组织的数据种类变化的能力,是人工智能的基础环境。(2)知识图谱定义知识图谱本质上是语义网络,是一种基于图的数据结构。它由节点和边组成,节点指的是现实世界中存在的“实体”,边指的是实体与实体之间的“关系”。它把所有不同种类的信息连接在一起而得到实体关系网络,提供了从“关系”的角度去分析问题、发现问题的能力。知识图谱是目前关系网络最有效的表示方式,知识图谱如图1所示。

2.知识图谱的逻辑和技术框架(1)RDIKW知识认知框架知识认知框架基于RDIKW模型,涵盖了知识从数据原料向智慧数据发展的全过程,自底向上包括原料层(R)、数据层(D)、信息层(I)、知识层(K)及智慧层(W)。其中,数据原料是知识最原始的状态,数据是信息的载体,信息是数据的含义,知识是信息的集合,智慧是正确判断和预测的能力的集合。知识认知框架如图2所示。原料层根据知识需求从各种渠道获取原始数据,它包括行内数据、第三方合作数据、互联网数据,涵盖非结构化、半结构化和结构化数据,涉及表格、文档、图片、音频、视频等多种形式。数据层以特定知识需求为导向而进行数据原料的筛选和清洗,并通过数据治理及整合将具备业务价值的数据原料与该特定知识主题进行匹配、映射和存储。信息层利用大数据平台对数据层筛选出来的数据原料进行分析和挖掘,探索数据原料背后的逻辑、规律和联系,将其整理成可以被业务理解且同时影响业务的另一种数据。知识层基于信息层数据对相关信息进行分析和推理而获取有用资料,知识既是信息的集合,又是信息的具体应用,体现了信息的本质、原则和经验,能够直接推动人的决策和行为,从而帮助业务建模和仿真。智慧层采用多种智能处理方法,基于知识层的标准知识,通过经验、阅历、见识和理解的累积,外推而形成对事物的深刻认识、远见,体现为一种卓越的判断力和前瞻性看法,用于指导业务决策。(2)ESER知识图谱技术框架知识图谱技术框架基于ESRE模型,用可视化技术描述知识资源及其载体,挖掘、分析、构建和显示知识及它们之间的关系。ESRE模型自左向右涵盖了知识提取(Extraction)、知识存储(Storage)、知识推理(Reasoning)、知识表现(Expression)等知识图谱构建的关键技术。知识图谱技术框架如图3所示。知识提取是利用自然语言处理、机器学习、模式识别等技术提取结构化数据,形成知识。知识存储将已有知识以图数据库的方式存储,通过标准接口接入各种数据包括实体和关系,并建立动态更新和动态扫描机制。知识推理是指在知识基础上进行机器思维、逻辑推理、求解问题,在前提和输入之下得出结论。知识表现通过图分析和图挖掘算法,建立知识之间的关联,以人可以理解的方式予以表现。(3)知识图谱管控框架知识图谱管控框架是一套基于知识管理愿景而构建的包括知识管控框架和制度体系的智能化管控体系。该框架自上而下的从知识质量、风险控制和效益评估等角度制定全方位的评估指标,以降低知识风险、提高知识质量为管理目标,以知识生命周期管理为核心,以规范建设和技术手段为支撑,核心目标是保障成熟知识的唯一性、合规性、时效性、易用性以及知识管理的有效性。(4)知识图谱关键模块知识图谱应用框架一般包括基础数据层、图谱平台层、应用场景层、业务系统层,其中最关键的模块包括NLP/数据、语料库、标签库、算法库、事件库、图构建六个模块(如图4所示)。

3.知识图谱在银行业的应用场景在深度学习能力的支撑下,知识图谱为银行海量、异构、动态的大数据表达、组织、管理及应用提供了一种更为有效的方式,使得银行知识处理的智能化水平更高,更加接近于人类的认知思维,知识图谱的应用场景通常包括智慧平台级、业务领域级、通用应用级(如图5所示)。(1)智慧平台级知识管理平台:利用NLP技术搭建知识原料库,基于知识图谱和深度学习等技术搭建知识生产工厂,借助工作流及搜索功能实现知识生命周期管理及应用,从而构建全员参与、共建共享、深度交流的知识管控体系,着力打造“以人为本,以智为根,以智养知”的知识管理模式。全行级智能知识库:基于知识管理平台坚实的知识处理、工作流等基础,利用人工智能技术,将商业银行相关的各领域知识、传统文档库、各类知识库等联接起来,形成统一视图的全行级智能知识库。银行智慧大脑:在全行级智能知识库的基础上,借助大数据的分布式计算能力,利用自然语言处理、生物特征识别、神经网络运算、机器学习、深度学习等技术实现机器对信息的认知和感知,将海量信息按照主题、时间、空间等多维度分类,让各种神经元可以直接或间接联接,最终具备“慧看、慧听、慧说、慧读、慧学、慧思、慧决”等智慧大脑必需的能力。(2)业务领域级按照银行金融业务分类,业务领域级的知识图谱可以划分为对公知识图谱、零售知识图谱等,重点应用主要是客户画像、客户识别、客户关系发现、智能获客、精准营销、智能产品推荐、风险事件传导、智能风险报告、风险前置等。(3)通用应用级综合市场各行业应用情况来看,知识图谱的通用应用场景包括搜索、问答、图析、地图、推演及协作等。基于知识图谱的智能搜索是一种基于长尾的搜索,搜索引擎以知识卡片的形式将搜索结果展现出来。用户的查询请求经过查询式语义理解与知识检索两个阶段,智能搜索引擎主要以集成的语义数据、直接的查询答案、查询答案推荐列表等三种形式展现。问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。传统问答系统更倾向于根据关键字搜索知识库,而基于知识图谱的问答系统以领域知识为基础,通过自然语言理解及对话管理平台,以“规则+模型”的方式提供了多个支持二次开发的实体识别模型,从而实现智能的、可感知、被信任的拟人交互过程。除此之外,地图、图析、推演等均以领域知识图谱为基础,将关系、特征、布局等信息展示给用户,比如风险地图、客户画像、资金关系圈、风险推演等应用。

三、对商业银行实施知识图谱的思考

1.商业银行具备知识图谱应用优势首先,经过多年运营,商业银行积累了海量的行内外知识点,这为知识图谱技术的应用奠定了坚实的数据基础。其次,数字化银行转型将会推动商业银行的数字化、智慧化、平台化和生态化运营,必将涉及和带来更多显性和隐形知识点。对客户、产品、交易及资金等维度的关系图谱的挖掘、更新和丰富,将更加有利于金融行业知识库的构建和应用。再次,大数据和人工智能为知识图谱的应用夯实了技术基础,特别是知识采集、数据的结构化处理、知识抽取、数据治理,以及算法开发等关键技术。最后,作为知识点密集的金融服务业,商业银行比较容易接受知识图谱在行业内的实践和应用,特别是在智能CRM、精准营销、智能风控和全行级知识管理等领域,能够为商业银行智能化运营赋能。

2.知识图谱为商业银行全行级知识管理提供新思路由于知识图谱在表达关系网络、知识融合及推理方面具有天然的优势,商业银行可以利用该技术进行全面的知识提取、知识积累、知识更新和知识整合,特别是客户、资金、交易及业务等关系网的全面建设和管理,这为商业银行全行级知识管理平台和智慧大脑的建设提供了新的思路。第一阶段,知识生产系统。通过爬虫平台、API,将互联网数据、第三方数据输入到知识生产系统,基于NLP自然语言处理引擎,对外部文档和源数据进行结构化数据治理,整理成行内可以使用的标准数据格式,并支持海量数据存储。第二阶段,知识处理体系。基于安全大数据平台技术,对结构化的原始数据进行分析加工,整理成业务可以直接理解的内容。第三阶段,金融知识平台。基于知识处理体系,对信息进行集合、关联、分析和仿真,分析其中隐含的本质、原则、逻辑和经验,帮助业务建模以支撑管理层决策。第四阶段,智慧大脑。基于人工智能、大数据、云计算等新技术,将各条线、部门、业务、岗位间的标准业务知识整合成关联、可用、完整的神经知识网络,通过机器学习、深度学习让系统具备自学习、自决策的智慧。

3.主要难点在知识图谱六大关键模块中,主要难点集中在NLP自然语言处理引擎、算法库。NLP自然语言处理引擎决定了NLP爬虫平台获取数据的能力以及获取数据的质量和数量,而这些原始数据作为知识图谱的知识原料又决定了知识谱图的水平。算法库包括图算法和金融算法,图算法决定了图构建、图存储和图操作的能力,知识原料丰富而图算法落后,依然不能构建出强大的知识图谱。金融算法作为知识图谱应用层的关键算法,决定了知识图谱能否很好地结合业务需求开展多方向的应用场景。知识图谱的建设和应用是一项长期持续的知识工程,既需要全面的大数据和AI技术,又需要行业专家、金融工程专家和数据科学家持续协作和实践。金融行业正在用更深入的视角去看待从知识到智慧的转化以及其中蕴含的价值,商业银行应积极培养知识工程人才,并结合自身特点将知识图谱技术应用于知识管理及其他业务实践,尝试促进商业银行的发展与创新。

作者:陈大值 单位:广发银行信息科技部

被举报文档标题:银行业知识图谱的应用

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/jrlw/yhylw/729420.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)