美章网 资料文库 数据挖掘物流管理范文

数据挖掘物流管理范文

数据挖掘物流管理

现代物流系统是一个复杂的系统,包括运输、仓储、配送、搬运、包装和物流再加工等诸多环节,信息流量十分巨大。巨大的数据流,使得企业很难对这些数据进行准确、高效的收集和及时处理,因此决策者也就很难做出快速、准确地决策,实现对物流过程的控制,降低整个过程的物流成本。随着知识经济和现代信息技术的迅猛发展,信息技术特别是网络技术的发展,为物流发展提供了强有力的支撑。物流管理信息系统是企业信息系统和企业信息化的基础,能够利用信息技术对物流中的各种信息进行实时、集中、统一管理。

数据挖掘技术就是利用机器学习统计数学和可视化技术,从大量的数据库中确认出有效的、新颖的、潜在的、有用的以及最终挖掘出可理解模式的高级处理过程。数据挖掘(Data?Mining)?能够挖掘蕴藏在海量数据中大量未知的和有价值的信息,为企业物流管理提供各种决策信息,减轻物流管理者从事低层次信息处理和分析的负担,使他们专注于最需要决策智慧和经验的工作,因此提高了管理和决策的水平。随着信息技术的不断发展,数据挖掘技术将为企业物流管理决策提供越来越强大的支持功能。

2数据挖掘的概念

数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

完整的数据挖掘过程分为四步进行。第一步是确定业务对象,清晰地定义出业务问题,认清数据挖掘的目的;第二步是数据准备,先要搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。接下来对数据进行预处理,研究数据的质量,为进一步的分析作准备。还要对数据进行转换,将数据转换成一个适合挖掘算法的分析模型;第三步是数据挖掘,完善从选择合适的挖掘算法,对所得到的经过转换的数据进行挖掘;最后一步是结果分析,解释并评估结果。

数据挖掘的主要技术有集合论法、决策树法、遗传算法、神经网络方法等。集合论法又分为粗(糙)集理论方法、概念树方法、覆盖正例排斥反例方法等。决策树法又分为ID3算法、CLS算法、IBLE算法等。遗传算法又分为分布并行遗传算法、进化算法等。

数据挖掘为管理决策提供的模型常见的有以下五类:

(1)分类发现模型。分类的目的是学会一个分类函数(分类器),通过分类器把数据库中的数据项映射到给定类别中的某一个。分类器的构造方法有统计方法、机器学习方法、神经网络方法、粗糙集方法等。

(2)聚类模型。聚类是把一组个体按照相似性归成若干类别,使得属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。

(3)关联规则模型。关联规则反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是R.Agrawal提出的Apriori算法。

(4)预测型知识模型。它是根据时间序列型数据,由历史的和当前的数据去推测未来的数据。时间序列预测方法有经典的统计方法、神经网络和机器学习等。

(5)偏差型知识模型。它是对差异和极端特例的描述,揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。

3关键技术分析

基于数据挖掘的物流管理信息系统的关键技术主要包括数据仓库、数据挖掘、数据分析工具等。

数据仓库技术。数据仓库是来自多个源的数据的存储库,它可通过Internet将不同的数据库连接起来,并将数据全部或部分复制到一个数据存储中心。数据仓库倾向于一个逻辑的概念,它建立在一定数量的数据库之上,这些数据库在物理上是可以分开的。数据仓库通过Internet打破地域界限,将它们合成一个逻辑整体,把一个海量的数据库展现在用户面前。数据仓库管理系统的一项重要工作是实现对传统数据库进行提取、清理和转载到数据仓库中。

数据挖掘技术。这是整个系统的难点和重点,主要涉及模式模型和挖掘算法。目前,己形成了多种数据挖掘方法,如分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常发现、趋势预测等。各种方法均有它一定的优点,也有它的不足。几种技术并不是单一的使用,而是根据实际情况综合的加以应用。现在一些流行的数据挖掘工具一般都包括了几种方法。如IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的MineSet系统都是多模式的挖掘工具。

数据分析工具。数据仓库虽然存有大量数据,但提供辅助决策的信息需要利用各种分析工具,如联机分析处理(OLAP)工具、统计分析和查询优化工具等。这些工具的性能对管理决策的效果有着重要的影响。目前已出现具有智能功能的强大的数据分析工具,这些分析工具不仅能在系统运行时采集和处理数据,同时也支持对其他业务系统的数据进行采集。

4、数据挖掘在物流管理中的应用

(1)选址问题。物流中心(流通中心、配送中心)选址问题属于最小成本问题,即求解是运输成本、变动处理成本和固定成本等之和为最小的最小化问题。物流中心选址,需要考虑到中心点数量和中心点如何分布等情况。由于单一中心选址较为简单,我们着重讨论多个中心选址的问题。所谓多中心选址是指在一些已知的备选地点中选出一定数目的地点来设置物流中心(流通中心、配送中心),使形成的物流网络的总费用最小,其中包括基本的投资费用、可变费用和不变费用。对于这类问题。在实际操作中,当问题规模变得很大,或者要考虑一些市场因素(比如顾客需求量)时,数学规划就存在一些困难,因此,针对这一问题,可以用数据挖掘中的分类树方法来加以解决。通过分类树的方法,不仅确定了中心点的位置,同时也确定每年各个地址间物品的运输量,使整个企业必要的销售量得到保证。企业的长期折现的总成本也会达到最小值。

(2)配送问题。配送问题是现代物流系统中重要的一部分,配送问题包括配送计划的编制、配送路线的设计和优化以及配送过程中的配载(混载)问题,在许多配送体系中,管理人员需要采取有效的配送策略以提高服务水平、降低货运费用。其中要考虑到的有车辆的路径问题,车辆路径问题是为一些车辆确定一些客户的路径,每一客户只能被访问一次,且每条路径上的客户需求量之和不能超过车辆的承载能力。其次还会考虑到车辆的利用能力,如果车辆在运输过程中的空载率过高或整车的运力不完全利用,这些无疑会增加企业的运输成本;另外涉及到车辆的运输能力,就必须考虑到货品的规格大小和利润价值的大小。在采取有效的配送策略时这些因素都必须同时考虑,这时如果能够对顾客的需求和运输路径综合起来进行分类,对整个配送策略中车辆的合理选择分派会有着较好的作用。

(3)仓储问题。仓库问题在物流管理中正扮演着非常重要的角色。仓库问题包括存储货物、中转运输、顾客服务三方面的内容,在这三方面的成本计算中,仓储成本无疑在企业总的成本核算中占很大一部分,如何合理安排货品的存储、压缩货品的存储成本正成为现代物流管理者不断思考的问题,对于货品的存放问题,哪些货品放在一起可以提高拣货效率?哪些货品放在一起却达不到这样的效果呢?其实在解决这个问题上,我们可以采取数据挖掘中的关联模式分析来帮助解决这方面的问题。

伴随着信息时代的数据量剧增的显著特征,深化物流信息管理的最有效的方法是在其中引进数据挖掘技术,数据挖掘可以从数据中发现趋势和模式,人们通过数据挖掘得到的回报就是将新发现的指示转变为经营上的成果,可以提高利润,降低成本等。充分合理的利用数据挖掘技术,可以进行市场预测和分析,这必将为正确的决策奠定坚实的基础。同时也为物流的管理和发展指明了方向。