华远智德(北京)科技有限公司 Jupiter Consulting (Beijing) Ltd.
  
技术讲堂


您的位置: 首页 技术讲堂 第三课 维度的内部结构
        第五讲 维度层次(2)

数据分析讲堂

第三课 维度的内部结构

第五讲 维度层次(2)

       让我们回顾一下由一组具有不同度量的实例——度量对所组成的层次类型,当然这里所有的度量都应该保证可比较性。因此实例——度量对的差别可能存在于两个方面:对于给定的实例可能度量会有所不同,或者是给定了度量但是实例有所不同。所有父——子、祖先——后裔、层次、粒度、换算系数或者分解的概念都可以用每个i的⊿m或者m/i表示。具体如图3.5.1所示。

       所有的层次都存在一些⊿m/i、父——子、多对一、或者换算系数的关系。在一个层次类型中,最大刻度的度量或者根节点,没有父节点度量。最小刻度的度量或者叶子没有子节点。当降低任何inmn中的m的时候,例如i1m1,该操作通常称做寻找子节点、寻找第一个后裔或者降低i1m1的层次。同样,提升i2m2或者i3m2中的m,通常称为寻找父节点、寻找第一个祖先,或者是提升i2或者i3的层次。

按此在新窗口浏览图片

和⊿m/i关系相对应的是⊿i/m关系。所有的邻居和系列之间的关系都是形如⊿i/m的关系。在图3.5.1中,只存在一个⊿i/m关系。从i1m1浏览或者引用i2m1的动作通常称为调用邻居或者是在i1m1所在的层次中移动。更进一步的⊿i/m关系依赖于其他的属性例如排序。在OLAP、关系数据库和统计中所有的类型或者维度引用都来自于⊿m/i和⊿i/m的组合。也就是说,⊿m/i的系列或关系定义了一个和“分解”等价的概念:而一组形如⊿i/m的系列或关系定义了一个和“位置”等价的概念。

       前面提到的所有层次关系的标准术语,如父——子、祖先——后裔、分解、级别和粒度都分别暗示了是水平层次或者是非水平层次。特别地,父——子和祖先——后裔关系暗含了非水平关系(注意术语中是如何引用⊿m的,引用的是没有任何绝对值的m,因此⊿和m总是成对出现的),而分解、级别和粒度都暗含了水平层次(注意这些术语引用的是m的绝对值,因此m是单独出现的)。因此,为了避免混淆,当引用一般意义上的层次的时候,需要说明某些特征或者属性是所有的层次都共有的,本讲义将用术语⊿m。这其中包括了引用一个实例或者一组实例的m值,两个实例之间的m距离和共享一个m值的一组实例。

         如果你更加喜欢拟人的术语,你完全可以使用父亲和孩子来代替m上升1和m下降1。但是父亲和孩子术语中暗含的一步性限制了它的功能。而且,虽然在这里并不明显,但是实际情况中的父子关系可能是非常复杂的,对于每个作为实例的人来说,在生物上都存在父母亲两个节点。因此不存在单一的父节点,更不要说单一的祖父节点了。我在本讲义中偶尔使用属于父亲和孩子节点的时候,都是特指m上升1或者下降1。这样可以让行文看起来更生动一些,而且很多供应商和分析师使用这些术语的频率是非常高的。

现在让我们在图3.5.1中的简单类型中添加一些元素,如图3.5.2所示。

按此在新窗口浏览图片

     让我们查看层次的叶子节点。请注意在i4m3和i5m3之间,以及i6m4和i7m4之间存在的明显的堂兄弟或⊿i/m的关系。但是i2m2和i3m2的所有孩子节点上是否都存在堂兄弟关系呢?答案是依赖于m3是否等价于m4。如图3.5.3所示,当m3和m4都表示了天,那么m2代表的是星期吗?

或者如图3.5.4所示,当m2和m3表示了他们向m1直接报告,m1代表了经理吗?通过这两个图,祝贺你,已经到了非水平和水平层次的交汇点。

按此在新窗口浏览图片

按此在新窗口浏览图片

        首页   |  公司介绍   |  服务理念   |  经营管理   |  企业管理 【TOP】      
版权所有 © 2015 jupiterst.com