华远智德(北京)科技有限公司 Jupiter Consulting (Beijing) Ltd.
  
技术讲堂


您的位置: 首页 技术讲堂 第一课 数据分析过程中的多维技术
        第四讲 多维显示

数据分析讲堂
  
第一课 数据分析过程中的多维技术
  
第四讲 多维显示
  
       我们已经指出了为什么物理立方体不能很好地起到可视化象征物的作用,同时介绍了表示多维数据集的逻辑结构的可视化原则,但是最终我们还是要在某个系统中看到这些数据。这样就产生了可视化多维数据的第三个需要解决的问题:如何将多个逻辑维度映射到二维空间中。一个很具体的案例就是如何将一个具有四个逻辑维度的问题,映射到行、列和页面这三个显示维上呢?方法其实就是将多个逻辑维度组织到同一个显示维度上。

     图4.1显示了一个按照产品和变量组织的三维表,其中的每个交叉点都标上了明确的名称。我们需要观察二维网络中的每一个交叉点是如何由维度中的成员构成的,另外还要注意维度中每个成员是如何与其他成员结合的。在这个简单的例子中,2个产品和3个变量一共形成6个产品变量组合。

按此在新窗口浏览图片

将两个维度映射为一个维度意味着创建一个二维交叉点的一维版本。显然任何一种安排都是可行的,但是通常的方法是将一个维度嵌套在另外一个维度中。图4.2显示了如何从图4.1中的二维网络形成一个变量嵌套在产品中的一维列表中。需要注意的就是,这个列表在产品和变量维度上的卷动方式,可以把它看作是一个一般循环:

For products = 1 to N

For variables = 1 to N

     End variables

End products

按此在新窗口浏览图片

       上面的例子是将变量嵌套在产品中的,与之相应的,图4.3则显示了如何将产品维度嵌套在变量维度内。我们可以看到在这两个小例子中,不管是一维方式,还是二维方式,元素的数量并没有发生变化。在合并的过程中数据并没有丢失。用这种方法我们可以将任意多个维度进行合并。

按此在新窗口浏览图片按此在新窗口浏览图片

现在,我们已经了解了如何进行维度的合并,下面我们来看一个在四维基础上在添加两个维度的例子,然后再详细讨论其中的变化过程。图4.4显示了一个六维数据集,包括了产品、时间、商店、客户、变量和场景六个维度。图4.5显示了一个三维网格,并且已经将每个维度关联到行、列和页面。这种对于三维数据可视化的方法能够很容易地拓展到N维数据集上。

图4.5和图4.6显示了两种将6个维度映射到行、列、页面3个轴的方法。

按此在新窗口浏览图片

按此在新窗口浏览图片

按此在新窗口浏览图片

在图4.5和图4.6中,我们会注意到每个显示在页面轴上的维度每次都只能显示一个成员。这个是无法改变的事实。假如我们希望在这些作为页面的维度上同时显示多个成员的话,则必须考虑如何组织这些成员。在一个二维的显示中,唯一的选择就是将其分布到行或者列中。但是,当一旦将其显示在行或列中之后,它们也就不再需要显示在页面维上了

多维网格具有非常大的灵活性,可以模仿任何类型的常规表格。表格只是网格的一种特例,在表格中所有或者大部分的维度都是以列的形式来展现的。图4.7中的表格可以看作是一个类似电子表格的网格,其中有5个维度作为列标题,维成员作为列的值,另外一个变量维度将作为列标题。

按此在新窗口浏览图片

请注意,这里销售变量的值是如何与每个维度的值相关联的。在这里,所有的维度是作为表格的主键存在的,而所有的百年量都是作为非主键存在的。从关系数据库的角度看,这个表格满足第三范式。这也就意味着所有非主键属性,就是销售额和销售量——都是被所有的主键或者说被主键唯一标识。对于每一个不同维度值的组合,有且仅有一个变量的值存在。

下图4.8,它以一种不同的方式显示了图4.7所示的数据。虽然两种表格都对每个维度分配了一列,但是在图4.8中将不同变量的名称单独作为一个字段存在。而其后的变量字段中的值在图4.7中是分布在多个变量字段中的。

按此在新窗口浏览图片

       从实践的角度来看,图4.7的表格要比图4.8表格的行数少而列数多。通过对维度进行重新配置之后,就能方便地改变数据的显示方式,这是多维系统在最终用户界面操作上的一个很大的优点。这个应该归功于数据的结构与数据显示的分离。尽管具体实现方式每个工具都会有所不同,但是其本质是一样的。

        首页   |  公司介绍   |  服务理念   |  经营管理   |  企业管理 【TOP】      
版权所有 © 2015 jupiterst.com