第一图书网

数据仓库与数据挖掘导论

李於洪 编 经济科学出版社
出版时间:

2012-8  

出版社:

经济科学出版社  

作者:

李於洪 编  

页数:

264  

字数:

310000  

内容概要

李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。
《数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。

书籍目录

第一篇 导引
第1章 数据仓库概念与内涵
1.1 数据仓库概念
1.1.1 数据仓库的产生
1.1.2 数据仓库应用实例:理解数据仓库的应用目标与作用
1.2 数据仓库的四个基本特征
1.2.1 数据仓库的数据是面向主题的
1.2.2 数据仓库的数据是集成的
1.2.3 数据仓库的数据是不可更新的
1.2.4 数据仓库的数据是随时间不断变化的
1.3 数据集市——部门级数据仓库
1.3.1 自上而下构建数据集市
1.3.2 自下而上构建数据集市
1.3.3 自上而下与自下而上结合构建数据集市
习题
讨论题
第2章 数据挖掘概念与内涵
2.1 数据挖掘概念
2.1.1 数据挖掘的产生
2.1.2 数据挖掘应用实例:理解数据挖掘的应用目标与作用
2.1.3 数据挖掘的定义
2.2 数据仓库与数据挖掘的关系
讨论题
第二篇 数据仓库
第3章 数据仓库的体系结构及其组成部分
3.1 数据仓库的体系结构
3.2 数据仓库的组成部分及其功能
3.2.1 源数据部分
3.2.2 数据准备部分
3.2.3 数据存储部分
3.2.4 信息传递部分
思考题
习题
讨论题
第4章 数据仓库数据的商业需求分析
4.1 收集商业需求数据碰到的问题
4.2 商业数据维度化分析
4.3 商业维度实例分析
思考题
习题
第5章 数据仓库的维度建模
5.1 维度建模基础
5.2 星型模式及其查询的钻取
5.2.1 星型模式维度表内容的特征
5.2.2 星型模式事实表内容的特征
5.2.3 星型模式的优势
5.3 雪花型模式:对维度表的再处理
5.4 聚集事实表:对关键指标的再处理
5.4.1 理解事实表的数据量
5.4.2 理解聚集事实表的作用
5.4.3 对事实表进行聚集的三种方法
5.4.4 聚集过程中相关问题讨论
思考题
习题
第6章 数据仓库中的联机分析处理——OLAP
6.1 OLAP的含义、规则与特征
6.1.1 OLAP的含义
6.1.2 OLAP的规则
6.1.3 OLAP的特征
6.2 OLAP的基本操作
6.2.1 切片
6.2.2 切块
6.2.3 上钻与下钻
6.2.4 旋转
6.3 OLAP模型结构
6.3.1 关系联机分析处理(ROLAP)结构
6.3.2 多维联机分析处理(MOLAP)结构
6.3.3 混合联机分析处理(HOLAP)结构
6.3.4 桌面联机分析处理(DOLAP)结构
6.3.5 客户联机分析处理(COLAP)结构
6.4 典型OLAP模型的数据组织与应用
6.4.1 ROLAP的数据组织与应用
6.4.2 MOIAP的数据组织与应用
6.4.3 ROLAP与MOLAP的数据组织与应用比较
思考题
习题
讨论题
第7章 元数据
7.1 数据仓库中元数据的重要性
7.1.1 数据仓库的用户需要元数据
7.1.2 数据仓库的开发者需要元数据
7.1.3 数据仓库的管理员需要元数据
7.2 关于数据仓库元数据的概念界定
7.3 元数据的几种分类方法
7.3.1 按用途对元数据进行分类
7.3.2 按数据仓库功能区域划分的元数据分类
7.3.3 按元数据的活动方式进行分类
7.4 元数据的作用
7.5 元数据管理的体系结构
7.5.1 集中的方法
7.5.2 分散的方法
7.5.3 分布的方法
思考题
习题
讨论题
第三篇 数据挖掘
第8章 关联分析
8.1 关联规则概念
8.1.1 关联规则的支持度和置信度
8.1.2 关联规则分类
8.2 关联规则挖掘算法
8.2.1 Apriori算法
8.2.2 强关联规则的有效性和可行性问题
习题
讨论题
第9章 神经网络算法
9.1 神经网络概念
9.1.1 神经网络原理
9.1.2 人工神经网络
9.2 人工神经网络模型
9.2.1 感知器
9.2.2 带隐层的人工神经网络
9.3 前馈神经网络
9.3.1 训练神经网络
9.3.2 后向传播如何工作
9.3.3 后向传播算法
9.4 有关神经网络研究中应该关注的几个问题
9.4.1 关于对神经网络的理解问题
9.4.2 关于神经网络应用中数据准备的问题
9.4.3 影响神经网络模型性能的部分因素
9.4.4 学习神经网络,需要强调以下几个问题
习题
讨论题
第10章 决策树算法
10.1 决策树分类概述
10.1.1 决策树分类步骤
10.1.2 决策树分类举例
10.2 ID3算法
10.2.1 信息论基本原理
10.2.2 ID3算法的基本思想与实例
10.2.3 ID3算法应用中应该关注的几个问题
习题
讨论题
第11章 聚类分析
11.1 聚类分析概述
11.1.1 聚类分析中的数据类型
11.1.2 聚类分析中相异度(相似性、差异度)测度方法
11.2 聚类分析方法
11.2.1 划分聚类方法
11.2.2 基于密度的聚类方法
11.2.3 聚类分析在数据挖掘应用中有待进一步研究的问题
习题
讨论题
第四篇 实验与工具
第12章 数据仓库实验与工具应用
第13章 神经网络建模实验与工具应用
第14章 决策树与关联分析实验与工具应用
参考文献

章节摘录

  在成功连接到该服务器之后将返回AnalysisManager,此时在AnalysisMan-ager出现了刚刚注册的服务器,如果该服务器在安装AnalysisServices时选择了创建示例数据库的话,此时可以看到“FoodMart2000”示例数据库。  在每个分析服务器上可以创建一个或多个数据库来存储多维数据集、数据挖掘模型和相关对象。应该为每组相关的计划创建一个数据库,每个数据库存储自己的对象,这些对象包括以下内容:  (1)数据源。数据源包含访问对象(如多维数据集)的源数据所必需的信息。一个数据库可以包含多个数据源,数据库中的多维数据集、分区和维度共享这些数据源。  (2)多维数据集。多维数据集即数据立方体。一个多维数据集只能有一个数据源,创建多维数据集时,可以从数据库的数据源中选择数据源,也可以创建新的数据源。  (3)共享维度。共享维度是可用于多个多维数据集的维度。MicrosoftSQLServer2000AnalysisServices包括几种维度,最常见的划分是常规维度、虚拟维度、父子维度和数据挖掘维度,其中任何一种维度都可以创建共享维度。共享同一数据源的共享维度可以包括在数据库中的任何多维数据集中。通过创建共享维度并在多个多维数据集中使用,可以节省大量时间,否则,就要在每个多维数据集内创建重复的专用维度。  (4)数据挖掘模型。数据挖掘模型是数据挖掘的中央对象,是一个虚拟结构,它表示关系或多维数据的分组和预测分析。MicrosoftSQLServer2000A-nalysisServices支持两种数据挖掘模型,基于多维数据集(数据立方体)的挖掘模型和基于关系数据库的挖掘模型,在AnalysisManager树形目录中分别用不同的图标表示。  (5)数据库角色。数据库角色包括WindowsNT4.0或Windows2000用户账户和组。通常,数据库角色创建后指派给多维数据集或数据挖掘模型,授予该角色对多维数据集或挖掘模型的访问权,同时创建一个与数据库角色同名的多维数据集或挖掘模型角色用以保存该角色的信息。在数据库角色中,可以控制对数据库中维度的访问,可以指定角色能够查看维度的哪些级别和成员。数据库角色是直接从属于数据库的,一个数据库中的数据库角色仅适用于该数据库和其中的对象。数据库角色可以通过数据库角色管理器和“数据库角色”对话框创建和维护。在AnalysisManager中,右击“数据库角色”,从弹出菜单中选择“管理角色”选项,就会弹出数据库角色管理器。角色的每个属性都可以通过右键菜单进行编辑。  ……


图书封面

广告

下载页面


数据仓库与数据挖掘导论 PDF格式下载



理论与实际相结合,很适合不是把数据仓库与数据挖掘作为研究内容的应用者阅读。


因为工作需要,本书正是我要找的和看的。不错,很喜欢。作者通过例子来说明问题,写得不错。


相关图书