华远智德(北京)科技有限公司 Jupiter Consulting (Beijing) Ltd.
  
技术讲堂


您的位置: 首页 技术讲堂 第三课 维度的内部结构
        第十二讲 单个类型中的多个层次

数据分析讲堂

第三课 维度的内部结构

第十二讲 单个类型中的多个层次

       在单个类型中可能存在多个层次。例如,在地理维度中,商店可以按照地区或者商店类型进行上卷。产品可以按照种类或者商标来上卷。类型中的每个层次是由一组惟一的级别或者具有层次关系的一组实例组成。例如,一个时间类型可以由两个层次组成:一个财政层次和一个日历层次。两个层次都可以共享天和月的级别。然后可以在季度和年份级别上有所差别。

     对于一个非水平层次来说,其层次可以用父子表来表示,当在一个维度中存在多个层次的时候,在层次函数中就需要指定其对应的层次。

       让我们根据下图来讨论产品的层次,看一下叶子节点所示的不同产品:床、便携式电视、影印机和传真机。我们还可以采用其他的方法对其进行分组而不只是家具和电器。我们还可以按照价格进行分组。如图3.12.1所示,类型便宜货、一般商品和奢移品代表了对产品维度成员的另外一种有效分组的方法。

按此在新窗口浏览图片

       选择合适的分组或聚合的中间级别对于我们理解和制定决策是非常重要的,因为数据只可能有一个细节级别和一个完全聚合的级别,但是可以存在很多聚合的中间级别。如图3.12.2所示,通向顶层的路径有很多。每一条路径都会特别强调某些因素,而忽略其他一些因素。例如,将商店级别的产品销售额聚合到城市、州和国家是强调了区域,也就是说强调了地区性的销售差别。中间级别可以有非常多种,例如产品价格分组、产品利润分组、产品类型、产品生产商分组,这些中间级别可以让我们从不同的角度观察和理解数据。这就是维度结构和统计之间的一个差别。例如,聚类分析等技术可以帮助你寻找到数据中的自然分组,从而作为一个有用的中间级别。

       不同的分组方法不仅将成员进行重组,它们还会产生完全不同的聚合数据。图3.12.3的两个表格显示了两种聚合数据。每一个电子表格都是二维结构,都由一个变量维度和一个产品维度组成。两个电子表格的变量维度是一样的;两个表格中产品的叶子节点都是一样的。但是,在图3.12.3中,表格A上卷成了家具、家用电器和办公用品,而表格B则上卷了便宜货和奢侈品。不同成员产生了差别,同时成员的数量也是不一样的。产品和价格是对单个产品进行分组的两种非常有效的方法。对于大多数多维产品来说,两种不同的上卷方法将被看成是在同一个维度中的两个不同的层次。

按此在新窗口浏览图片

按此在新窗口浏览图片

从这个意义上说,维度可以看做由叶子成员的集合,以及由这个集合派生出来的层次或者成员的集合这两个部分组成。换句话说,维度的所有成员——叶子成员,中间级别成员和根成员——组成了一个相同类型的单一的成员集合,这些成员作为一个整体组成了多因素/维度情况下的一个因素/维度。你需要记住维度中的所有成员,从叶子到根,在不同的分析中都是不一样的。

让我们再看一下图3.12.1,如果一个维度拥有多个层次,当从任何节点上卷的时候就可能存在两个或者更多个父亲,因此有必要指定你所浏览的父亲或者根节点。例如,如果从传真机上卷的时候,你希望浏览办公用品,那么就必须指明你浏览的方向是所有产品的方向而不是奢侈品的方向。不同的OLAP产品在是否提供和如何提供这个功能上是有区别的。很多OLAP 产品都会定义一个默认的主层次,这迫使你有时候需要使用某种不太直观的方法来指定你所要访问的另外一条路径。而有些产品则提供了很强的灵活性,让你可以根据报表的上下文自定义层次关系。

Time.fiacsl_hierarchy.yearend

读做“时间维度fiscal hierarchy中的yearend成员”。

Geography.store_type_hiearchy.department_atores

读做“地理维度的store_typehierachy中的商店部门级别”。

Myfavoritedimension.alernativehierarchy.most popular member.upl

读做“我喜欢的维度上可替换的层次中最流行的成员的父节点”。

        首页   |  公司介绍   |  服务理念   |  经营管理   |  企业管理 【TOP】      
版权所有 © 2015 jupiterst.com