华远智德(北京)科技有限公司 Jupiter Consulting (Beijing) Ltd.
  
技术讲堂


您的位置: 首页 技术讲堂 第三课 维度的内部结构
        第九讲 具有序数排序实例的带级别维度

数据分析讲堂

第三课 维度的内部结构

第九讲 具有序数排序实例的带级别维度

         对于名词级别来说,可以很容易按照某种原则对其进行排序,例如,对于地理维度中的商店级别,可以按照销售额进行排序,或者对于国家级别可以按照人口进行排序。如果一个带有级别的维度中的某些级别已经经过了排序,那么这个时候可以将排序操作作用到该维度的级别上,这种数据集的一般形式如下:

(Type.level.ordinal_ordering.)~ [Content1,Content2,…]

         上述表达式可以理解为对于该类型排序级别中的每一个实例,表达式左边和右边之间的符号“~”表示了一个一对一的关系,在这里就是说左边的每一个元素都和右边的某个内容值相对应。下面是一些例子:按照最终名词(L)排序的运动员的年龄(C)维度,按照最近一次竞选中政党获得票数(L)排序的投票者收入中位数(C)维度,或者是按照商店大小(L)排序的新商店(C)维度的投资回报率。

         让我们回顾一下上下文对层次的谈论,其中存在着两种基本的类型关系:⊿M/I和⊿I/M。非水平层次的一个弱点是它缺乏对于⊿M/I的支持。这是因为对于一个实例而言,除了直接的兄弟关系外,就没有其他自然的、非层次和跨越式的引用功能。即使对于兄弟关系,也必须保证父节点的所有孩子都属于同一个度量。该假设很可能不会成立,因为很有可能有些孩子是叶子节点而其他一些则包含了更深的层次。对于后者,将所有的孩子都同等对待显然是不太合适的。

         但是在非水平层次中,⊿I/M总可以得到有意义的结果,除非设计者发现其中存在的语义错误。这个就是水平层次的一个优点。你总是可以引用度量的其他实例和度量本身,从这个意义上来说,它们就象一个系列:名词、序数或者基数。

         如果实例可以按照级别进行排序的话,那么就可能对不同的级别采用不同的排序技术。让我们考察图3.9.1。注意其中元素之间的连接,例如,Dijon商店和Burgundy区域之间的连接。如果你对城市按照大小进行排序,这些级别的连接会发生什么变化呢?变化的情况如图3.9.2所示。

       简单地说,⊿M/I关系并没有发生变化。你依然可以从Dijon访问到Burgundy地区。但是,现在你已经不能够通过使用地区Burgundy.under来获得一个垂直划分了,得到的结果也变成城市级别中按照城市大小排序的实例。

按此在新窗口浏览图片

按此在新窗口浏览图片

        首页   |  公司介绍   |  服务理念   |  经营管理   |  企业管理 【TOP】      
版权所有 © 2015 jupiterst.com