新闻资讯
看你所看,想你所想

实战Hadoop

实战Hadoop

实战Hadoop

《实战Hadoop》是中国电子学会云计算专家委员会刘鹏教授主编的国内第一本原着的Hadoop编程技术书籍。它由电子工业出版社于2011年9月出版,并在首届中国云计算技术与套用大会上首发。作为谷歌云计算技术的开源实现,Hadoop是目前最受关注的云计算技术平台。该书强调动手、强调实战,以风趣幽默的语言和一系列生动的套用实例,系统地讲授了Hadoop的核心技术和扩展技术,包括:MapReduce、HDFS、HBase、Hive、Pig、Cassandra、Chukwa和ZooKeeper等,并给出了3个完整的基于Hadoop的云计算综合套用实例,及保障Hadoop平台可靠运行的方法。本书主要作者来自国内少有的拥有丰富经验的云计算技术研发团队。

基本介绍

  • 书名:实战Hadoop
  • 作者:刘鹏
  • 出版社:电子工业出版社
  • 出版时间:2011年9月

读者对象

云计算研发人员,包括院校、科研机构师生和科研人员,各类云计算技术企业和套用企业研发人员

图书目录

第1章 神奇的大象——Hadoop
1.1 初识神象 1.2 Hadoop初体验 1.3 Hadoop世界的风俗
第2章 分久必合——MapReduce
2.1 MapReduce基础
2.2 一切从“Hello World”开始——文字计数
2.3 MapReduce,你够了解吗?
2.5 实战:倒排索引
2.4 实战:用MapReduce进行海量数据排序
第3章 HDFS:不怕故障的海量存储
3.1 开源的GFS——HDFS 3.3 HDFS API之旅 3.4 档案操作示例
3.5 实战:用HDFS存储海量视频数据
第4章 HBase:一张无限大的表
4.1 HBase数据模型
4.2 HBase的入门仪式
4.3 HBase操作演练
4.4 HBase查询语言HBQL
4.4 实战:用HBase管理通话记录数据
第5章 MapReduce进阶
5.1複合键值对的使用
5.1.1用複合键让系统完成排序
5.1.2把小的键值对合併成大的键值对
5.2用户定製数据类型
5.2.1 Hadoop内置的数据类型
5.2.2用户自定义数据类型的实现
5.3用户定製输入输出格式
5.3.1 Hadoop内置的档案输入格式和RecordReader
5.3.2用户自定义InputFormat和RecordReader示例
5.3.3 Hadoop内置的档案输出格式和RecordWriter
5.3.4用户自定义OutputFormat和RecordWriter示例
5.4用户定製Partitioner和Combiner
5.4.1用户定製Partitioner
5.4.2用户定製Combiner
5.5叠代完成MapReduce计算
5.5.1基本问题
5.5.2叠代MapReduce计算任务示例
5.6複合MapReduce计算过程的实现
5.6.1顺序化MapReduce任务的执行
5.6.2具有数据依赖关係的MapReduce任务的执行
5.6.3 MapReduce前处理和后处理步骤的链式执行
5.7多数据源的连线
5.7.1基本问题
5.7.2用DataJoin类实现Reduce端Join
5.7.3用档案複製方法实现Map端Join
5.7.4带Map端过滤的Reduce端Join
5.7.5多数据源连线解决方法的限制
5.8全局参数/数据档案的传递
5.8.1全局作业参数的传递
5.8.2全局数据档案的传递
5.9 关係资料库的连线与访问
5.9.1从资料库中输入数据
5.9.2向资料库中输出计算结果
5.10其它处理技术
5.10.1查询任务相关信息
5.10.2划分多个输出档案集合
第6章 Hive:飞进数据仓库的小蜜蜂
6.1 搭建蜂房——Hive安装
6.2 Hive的服务
6.3 HiveQL的使用
6.4 Hive示例
6.5 实战:?
第7章 Pig:一头什幺都能吃的猪
7.1 Pig的安装
7.2 Pig Shell的使用
7.3 Pig Latin程式语言
7.4 Pig示例
7.5 实战:?
第8章 Cassandra:来自Facebook的女神
8.1 让Canssandra飞起来
8.2 洞察Cassandra的全貌
8.3 Cassandra与Hadoop联姻
8.4 Cassandra操作示例
8.5 实战:?
第9章 Chukwa:收集数据的大乌龟
9.1 Chukwa安装与配置
9.2 Chukwa的设计
9.3 Chukwa实践之路
9.4 实战:?
第10章 动物管理员ZooKeeper
10.1 谁动了ZK的钥匙
10.2 ZK是个谜
10.3 何去何从的ZK
10.4 ZooKeeper演练
10.5 实战:?
第11章 综合实战:打造一个搜寻引擎
第12章 综合实战:生物信息学套用
第13章 综合实战:行动网路信令监测
第14章 高枕无忧:Hadoop容错

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com