华远智德(北京)科技有限公司 Jupiter Consulting (Beijing) Ltd.
  
技术讲堂


您的位置: 首页 技术讲堂 第二课 系统的功能性需求
        第六讲 OLAP和数据挖掘

数据分析讲堂
  
第二课 OLAP系统的功能性需求
  
第六讲 OLAP和数据挖掘
  
         OLAP和数据挖掘的关系问题是很多人都混淆了的,在这有必要将这个问题阐述清楚。当OLAP在1994年、1995年产生的时候,产品供应商们很自然地取得了与其他相关技术一样的成功。于是在1995年到1997年期间,人们进行了很多尝试将数据挖掘产品化,并且用和OLAP工具一样的方式进行推销。但是这些尝试从一开始就是值得怀疑的,因为正确使用数据挖掘工具需要具备基本的统计知识,从而不可能将数据挖掘产品销售给使用OLAP查询工具的同一批商业用户。除此之外,作为销售和市场活动的一部分,很多数据挖掘供应商甚至通过批评OLAP,或至少是置之不理,来提升数据挖掘的地位。于是在很多刊物上都出现了这样的宣传:OLAP是在汇总数据上进行的,而数据挖掘是在详细数据上进行的。这种非常不正确的说话是如此地扎根在很多人的思想中,以至于要花很多时间来消除这种错误的认识。

           OLAP和数据挖掘之间的区别完全和汇总及详细数据无关。它们之间的差别,应该是描述型和建模型之间的差别。OLAP工具中的功能和算法(如聚合、分配、比率、比例、乘积等)都是描述型建模功能,而数据挖掘工具包中的功能(如回归、神经元网络、决策数、聚类等)都是模式发现和探索型建模功能。

           OLAP工具除了提供描述型建模功能外,还提供构建复杂结构的功能,如带层次的维度和跨度引用,而这些都是在数据挖掘工具中没有的。一般的数据挖掘和统计软件都是以变量和记录为基础的。

           一个好的数据挖掘系统必然要连接到原始数据,而一个好的OLAP环境也同样如此。汇总来自于原始数据,而且很多数据挖掘过程中发现的模式也是来自于部分汇总的派生变量自身以及它们之间的关联。很少有销售预测是针对存货单元的,大多数的预测都是在产品、品牌、种类和部门级上给出的。

           很多数据挖掘工作者在工作中没有使用OLAP工具并不意味着他们没有使用OLAP功能。相反地,所有的数据挖掘工作者在运行特定的模式发现算法之前都会做一些OLAP的分析工作。很多数据挖掘工作者都是依靠数据挖掘工具中提供的简单计算或者后端数据库来完成这部分工作的。

  
  

        首页   |  公司介绍   |  服务理念   |  经营管理   |  企业管理 【TOP】      
版权所有 © 2015 jupiterst.com