最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

数据仓库与数据挖掘教程(第2版)课后习题答案 第三章

来源:动视网 责编:小OO 时间:2025-10-01 19:21:22
文档

数据仓库与数据挖掘教程(第2版)课后习题答案 第三章

第三章作业1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。P40联机分析处理是共享信息的快速分析。它体现在四个特征:(1)快速性(2)可分析性(3)性(4)信息性2.OLAP准则中的主要准则有哪些?P41(1)概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受的维和聚集层次3.什么是维?关系
推荐度:
导读第三章作业1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。P40联机分析处理是共享信息的快速分析。它体现在四个特征:(1)快速性(2)可分析性(3)性(4)信息性2.OLAP准则中的主要准则有哪些?P41(1)概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受的维和聚集层次3.什么是维?关系
第三章作业

1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。P40

联机分析处理是共享信息的快速分析。它体现在四个特征:(1)快速性(2)可分析性(3)性(4)信息性

2.OLAP准则中的主要准则有哪些?P41

(1)概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受的维和聚集层次

3.    什么是维?关系数据库是二维数据吗?如何理解数据?P43

    维是人们观察数据的特定角度。关系数据库不是二维数据,只是通过二维关系表示了数据的概念。数据就是从多个特定角度来观察特定的变量。

4.

MDDB(Multi Dimensional Database, 数据库)是以的方式组织数据,即以维作为坐标系,采用类似于数组的形式存储数据。

RDBMS(relational database management system,关系型数据库管理系统)通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据

MDDB特点:

1.数据库中的元素具有相同的数值

2.数据库表达清晰,

3.占用存储少

RDBMS的特点:

1.数据以表格的形式出现

2.每行为各种记录名称

3.每列为记录名称所对应的数据域

4.许多的行和列组成一张表单

5.若干的表单组成database

5.

1.数据存取速度

ROLAP服务器需要将SQL语句转化为存储语句,临时“拼合”出数据立方体。因此,ROLAP的响应时间较长。

MOLAP在数据存储速度上性能好,响应速度快。 

2.数据存储的容量

ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有。

MOLAP通常采用多平面叠加成立体的方式存放数据。

当数据量超过操作系统最大文件长度时,需要进行数据分割。

数据库的数据量级难以达到太大的字节级。 

3.计算的能力

MOLAP能够支持高性能的决策支持计算。

ROLAP无法完成多行的计算和维之间的计算。

4.维度变化的适应性

MOLAP增加新的维度,则数据库通常需要重新建立。

ROLAP对于维表的变更有很好的适应性。

5.数据变化的适应性

当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构数据库。

在ROLAP中灵活性较好,对于数据变化的适应性高。

6.软硬件平台的适应性

ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。

7.元数据管理

目前在元数据的管理,MOLAP和ROLAP都没有成形的标准。 

6.

在HOLAP中,对最常用的维度和维层次,使用数据表来存储,对于用户不常用的维度和数据,采用ROLAP星型结构来存储。

7.数据显示的两种方法:关系数据库方式和数据库方式。

关系数据库可以显示更的数据,但用事实表显示数据时,重复数据很多,也很繁琐;数据库虽然不能同时显示三维以上数据,但显示的数据很精炼。

8.类型结构:每一个维度用一条线段来表示,维度上的每个成员都用线段上一个单位区间来表示。

例如,用三个线段分别表示时间、产品和指标三个维的类型结构:

9.举例说明四维数据显示?

 答·

10.举例说明六位数据显示?

答:

11、数据显示的经验规则是什么?

答:数据的显示只能在平面上展现出来,用数据库显示时,不能同时显示三维以上数据,但可以固定一些维成员,重点显示两维维数据。最有效表示数据使用类型结构(MTS),即每一维用一条线段表示,维度中每一个成员都用线段上的一个区间表示。还可以使用行、列和页表三个显示组来表示。

    经验规则:

1.将维度尽量放在页中,除非确定需要同时看到一个维度的多个成员;

2.当维度嵌套在行货列中时,考虑到垂直空间比水平空间更有用,所以讲维度嵌套在列中比嵌套在行中要好;

3.在决定数据的屏幕显示方式前,应首先弄清楚需要查找和分析比较的内容;

12、举例说明OLAP的数据分析的切片操作。

答:切片就是在某两个维上取一定区间的维成员或全部维成员。

如用三维数组表示为(地区,时间,产品,销售额),如果在地区维度上选定一个维成员,就可以得到在该地区的一个切片(关于时间和产品的切片)。

13

    比如部门销售数据表中部门1的销售额为900元,对时间维进行下钻操作,可以得到各个季度分别的销售额为多少。

14

(1)切片:切片就是在某两个维上取一定区间的为成员或全部维成员,而在其余的维上选定一个维成员的操作。切片的作用就是舍弃一些观察角度,使人们能在两个维上集中观察数据。

(2)切块:切块分两种情况:(1)在数据的某一个维上选定某一区间的维成员的操作。(2)选定数组的一个三维子集的操作。切块可以看成是在切片的基础上确定某一个维成员的区间得到的片段,也即由多个切片叠合起来的。

(3)钻取:向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据,向上钻取获取概括性信息。

(4)旋转:通过旋转可以得到不同视角的数据,旋转操作相当于平面数据将坐标轴旋转。

15、广义OLAP功能如何提高数据分析能力。

广义OLAP功能主要是通过四个模型逐层深入从而提高数据分析能力。这四个模型分别是:

(1)绝对模型

它属于静态数据分析,通过比较历史数据值或行为来描述过去发生的事实。该模型查询比较简单,综合路径是预先定义好的,用户交互少。

(2)解释模型

它也属于静态数据分析,分析人员利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。

(3)思考模型

它属于动态数据分析,旨在说明在一维或上引入一组具体变量或参数后将会发生什么。分析人员在引入确定的变量或公式关系时,必须创建大量的综合路径。

(4)公式模型

它的动态数据分析能力更高,该模型表示在多个维上,需要引入哪些变量或参数,以及引入后所产生的结果。

16、说明数据立方体的概念

数据立方体的概念是1996年,Jim Gray等首次提出的。数据立方体是实现数据查询与分析的一种重要手段。实质上,数据立方体就是数据仓库结构图中的综合数据层。从此,基于数据立方体的生成方法一直是OLAP和数据仓库领域研究者所关注的热点问题。

    多数据集的属性分为维属性和度量属性。维数性是观察数据对象的角度,而度量属相则反映数据对象的特征。对于数据分析而言,本质上是沿着不同的维度进行数据获取的过程。在数据立方体中,不同维度组合构成了不同的子立方体,不同维值的组合机器对应的度量值构成相应的对于不同的查询和分析。因此,数据立方体的构建和维护等计算方法成为了数据分析研究的关键问题。

17答:OLAP的逻辑结构由OLAP视图和数据存储两部分组成。OLAP视图:对于用户来说它是数据仓库或数据集市中数据的逻辑表示,不管数据怎么存储和存储在何处。数据存储:要求选择数据实际存储方式和实际存储位置,两种常用的选择是数据存储和关系数据存储。

18答:OLAP的物理结构包括基于数据存储的两种方式:数据存储和关系数据存储。数据存储主要有两种选择:数据存储于客户端或OLAP服务器。在第一种情况,数据存储于客户端,数据分析也在客户端,这样形成了“胖”客户端,这是一种两层客户/服务器的物理结构。在第二种情况,数据存储放在OLAP服务器中,抽取数据仓库中的数据,然后将其转换成数据结构,并把OLAP服务器传给客户端,这时客户端就变成了“瘦”客户端,这是一种经典的三层客户/服务器物理结构。

19.说明浓缩立方体的压缩方法和效果。

答:浓缩立方体计算方法的基本原理是,在某些属性或组合下的一个元组相对于其他元组具有唯一性,则称为基本单一组(BST),当它的超集也是BST,且都是取同一度量值,在聚集运算时,可以把这些属性的度量值对应的元组压缩成一条元组存储。

一般来说,浓缩立方体的压缩率可以达到30%-70%。

20.数据分析的MDX语言与数据库的SQL语言有什么不同?

答:MDX语言结合了数据集,指定“维度”(ON子句)和“创建表达式计算的新成员”(MEMBER子句),这样就可以来从数据集中挖掘出指定的数据。

21MDX提供的函数children来完成这个操作。Children 函数返回一个自然排序的集,该集包含指定成员的子成员。 如果指定的成员没有子成员,则此函数返回一个空集。

示例

下例将返回 Geography 维度中 Geography 层次结构的 United States 成员的子成员。

SELECT [Geography].[Geography].[Country].&[United States].Children ON 0

FROM [Adventure Works]

22用相应的表达式函数来计算。

文档

数据仓库与数据挖掘教程(第2版)课后习题答案 第三章

第三章作业1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。P40联机分析处理是共享信息的快速分析。它体现在四个特征:(1)快速性(2)可分析性(3)性(4)信息性2.OLAP准则中的主要准则有哪些?P41(1)概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受的维和聚集层次3.什么是维?关系
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top