教育培训消费

机构数据分析培训之Cube技术

0回复 阅读 45

一、解答

Cube 在大数据中是运用 MOLAP 进行使用的一种技术

MOLAP 代表基于多维数据组织的 OLAP 实现(多维 OLAP)。

多维数据组织为核心,也就是说MOLAP使用多维数组来存储数据

多维数据在存储中会形成“Cube”结构。

它的特点是明细数据和聚合数据都存储在Cube中,所以用空间换取效率,查询效率高,但生成需要大量的时间和空间。

二、补充

Cuboid

给定一个数据模型,我们可以对其上的所有维度进行组合。

对于 N 个维度来说,组合的所有可能性共有 2 种。

对于每一种维度的组合,将度量做聚合运算,然后将运算的结果保存为一个物化视图,称为 Cuboid 。

所有维度组合的 Cuboid 作为一个整体,被称为 Cube 。

所以简单来说,一个 Cube 就是许多按维度聚合的物化视图的集合。

三、OLAP的多维分析操作

OLAP的目标是满足决策支持或者满足在多维环境下特定的査询和报表需求,它的技术核心是"维"这个概念。

“维”( Dimension)是人们观察客观世界的角度,是一种高层次的类型划分。

“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要属性定义为多个维,使用户能对不同维上的数据进行比较。

因此,OLAP也可以说是多维数据分析工具的集合。

OLAP 的基本多维分析操作有钻取、切片和切块,以及旋转等。

1.钻取就是改变维度层次和分析的粒度。它包括向上钻取(rollup)和向下钻取(drilldown)。 Rollup 是将低级详细数据概括为某一维度上的高级汇总数据,或减少维数;而drilldown则相反,从汇总数据到详细数据进行观察,或者增加维数。

2.切片和切块是在部分维度上选择值后,观察数据在剩余维度上的分布情况。如果只剩下两个维度,就是一个切片;如果有三个,那就是切块。

3.旋转就是改变维度的方向,即重新排列维度在表格中的位置(如行列的交换)。

以上就是关于之Cube技术的讲解,如果想了解更多详情,请点击成都加米谷大数据官网吧!、大数据开发培训、数据分析与挖掘,零基础班本月正在招生中,课程大纲及试学视频可联系客服获取!

标签

大数据 大数据培训
展开全文
一键安装官方客户端
江城热点及时推送 阅读体验更流畅

值得推荐

首页 版块

和武汉妹子交朋友

了解武汉的窗口

在武汉结婚  买房  装修  旅游  购物

用得意生活app有优惠

立即下载