第一图书网

深入浅出云计算

鲍亮,陈荣 编著 清华大学出版社
出版时间:

2012-10  

出版社:

清华大学出版社  

作者:

鲍亮,陈荣 编著  

页数:

437  

字数:

723000  

Tag标签:

无  

内容概要

  《深入浅出云计算》作者以多年实际研发项目为背景,通过项目实战与代码分析,深入浅出地讲述云计算的基本概念,云计算的核心技术细节以及使用云计算平台解决实际问题的思路与方法。
  全书共分4篇。第1篇循序渐进地介绍云计算的基本概念,学习云计算需要掌握的基本知识和云计算环境搭建方法;第2篇基于hadoop开源云计算平台,讲解如何构建一个基于云计算的应用系统,了解云计算应用系统的设计方法:第3篇以开源的hadoop云计算平台为分析对象,在源代码层次上对分布式文件系统、mapreduce计算模型、nosql数据库和集群管理算法与技术等云计算核心技术进行深度剖析;第4篇为云计算应用篇,介绍了基于hadoop云计算平台的4个高级应用框架,读者可以结合自己的应用需求与场景,使用这些框架解决实际问题。
  《深入浅出云计算》理论联系实践,既有理论深度又有实用价值,可作为高校教材使用,也可作为云计算研发人员以及爱好者的学习和参考手册。

书籍目录

第1篇 初始云计算
第1章云计算介绍
1.1云计算相关概念
1.2云计算的历史
1.3云计算的现状
1.4本章小结
第2章云计算技术基础
2.1hdfs相关技术
2.2mapreduce相关技术
2.3hbase相关技术
2.4zookeeper相关技术
2.5本章小结
第3章云计算开发环境搭建
3.1集群环境介绍
3.2 hadoop环境搭建
3.3 hadoop集群配置
3.4hbase环境搭建
3.5zookeeper环境搭建
3.6本章小结
第2篇 浅出云计算
第4章应用实例:图像百科系统
4.1应用背景
4.2需求分析
4.3核心业务处理流程
4.4总体设计
4.5本章小结
第5章使用hdfs存储海量图像数据
5.1hdfs介绍
5.2 hdfs接口介绍
5.3图像百科系统中的图像存储
5.4系统实现
5.5本章小结
第6章使用mapreduce处理图像
6.1分布式数据处理mapreduce
6.2使用mapreduce编程模犁
6.3更新图像百科条目的mapreduce设计
6.4 mapreduce对更新条目的实现
6.5本章小结
第7章使用hbase存储百科数据
7.1 hbase的基本特征
7.2使用hbase编程
7.3fotospedia系统的数据库设计
7.4 fotospedia系统的数据库实现
7.5本章小结
第8章使用zookeeper管理集群
8.1zookeeper详细介绍
8.2 zookeeper的使用方法及api介绍
8.3图像百科系统集群管理详细设计
8.4图像百科系统集群管理实现
8.5本章小结
第3篇 深入云计算
第9章深入分析hdfs
9.1hdfs核心设计机制
9.2 hdfs源码总体介绍
9.3核心代码分析
9.4 hadoop支持的其他文件系统
9.5本章小结
第10章深入分析mapreduce
10.1mapreduce框架结构
10.2代码静态分析
10.3代码详细分析
10.4本章小结
第11章深入分析hbase
11.1hbase体系与原理
11.2hbase总体结构
11.3hbase关键剖析
11.4本章小结
第12章深入分析zookeeper
12.1概述
12.2代码静态分析
12.3代码情景分析
12.4本章小结
第13章应用pig实现并行数据处理
13.1apachepig简介
13.2 pig的安装与配置
13.3深入分析pig
13.4 pig实例分析
13.5 pig与sql比较
13.6本章小结
第14章应用hive构建数据处理平台
14.1hive简介
14.2hive安装配置
14.3 hive使用与操作
14.4实例介绍
14.5本章小结
第15章应用mahout实现机器学习算法
15.1mahout概述
15.2mahout安装配置
15.3mahout使用简介
15.4本章小结
第16章应用hama实现分布式计算
16.1hama简介
16.2hamabsp介绍
16.3hama安装配置
16.4实例介绍
16.5本章小结
附录

章节摘录

版权页: 插图: 原子性:整个事务中的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。 一致性:在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。隔离性:两个事务的执行是互不干扰的,一个事务不可能看到其他事务运行时中间某一时刻的数据。两个事务不会发生交互。 持久性:在事务完成以后,该事务对数据库所做的更改被持久地保存在数据库之中,并不会被回滚。 某一数据在集群中不同节点中的内容一致。 可用性(Availability):每一个操作无论是请求失败或成功,总是能够在确定的时间内得到响应。 分区容忍性(Partition Tolerance):在出现网络分区(如断网)等情况时,系统中任意信息的丢失不会影响系统的继续运行(除非整个网络都故障)。 这个定理使得数据库架构师在设计数据库系统时,无须再去费尽心机地尝试使系统同时满足一致性、可用性和分区容忍性这三种需求,而可以集中精力按照系统的需求,设计合适的系统架构来满足这三者中的两个。 一般而言,传统的关系数据库大都是满足CA的,放弃了分区容忍性来满足强一致性和高可用性的需求。而对于分布式系统而言,系统数据分布在不同的网络节点中,因此大多数情况下需要满足分区容忍性来降低单点失效等问题的风险,因此一般只有CP和AP两种选择。 AP模式:确保系统可用性和分区容忍性,弱化了数据一致性要求,一般以“最终一致性(Eventual Consistency)”来实现一致性需求。典型的系统如Dynamo、Tokyo Cabinet、Cassandra、CouchDB、SimpleDB等。 CP模式:确保分布在网络不同节点上数据的一致性,因此降低了对可用性的要求。 这种系统如BigTable、HBase、MongoDB、Redis、MemcacheDB、BerkeleyDB等。 2.3.4一致性模型 在CAP理论中,提出了分布式系统设计中对一致性的取舍。事实上,设计分布式系统时降低一致性要求,并不是说完全不考虑…致性,而是相对于强一致性而言,采取一定的折中方式,系统一般还是需要满足最终一致性的。常用的一致性模型如下。 (1)强一致性(Strict Consistency):系统中某个数据被成功更新(事务成功返回)后,后续任何对该数据的读取操作得到的都是更新后的值。 (2)弱一致性(Weak Consistency):系统中的某个数据被更新后,后续对该数据的读取操作得到的不一定是更新后的值,这种情况下通常有个“不一致性时间窗口(InconsistencyWindow)”存在,当更新操作完成并经过这个不一致性时间窗口后,后续读取操作得到的就是更新后的值。


编辑推荐

《深入浅出云计算》理论联系实践,既有理论深度又有实用价值,可作为高校教材使用,也可作为云计算研发人员以及爱好者的学习和参考手册。

图书封面

图书标签Tags

广告

下载页面


深入浅出云计算 PDF格式下载



这本书对云计算初学者有很大帮助,让你对云计算有个初步了解


这本书很好!谢谢作者,谢谢当当!


促销很给力,书的质量也很好


还可以吧,内容还没细看


很不错,封面的感觉很好的,恩


正如书名,对云计算讲述的很透彻,的确是深入浅出


有些章节写得还不错


建议不买,**中的**


相关图书