基于Hadoop的大数据分析和处理

基本信息

基于Hadoop的大数据分析和处理

作译者：魏祖宽,刘兆宏

出版时间：2017-06

千字数：510

版次：01-01

页数：268

开本：16开

I S B N ：9787121317392

内容简介

本书基于云计算和大数据，介绍大数据处理和分析的技术，分为两部分。第一部分介绍Hadoop基础知识，内容包括：Hadoop的介绍和集群构建、Hadoop的分部式系统架构、MapReduce及其套用、Hadoop的版本特徵及进化。第二部分以云计算为主题，详细论述利用Hadoop的大数据分析和处理工具，以及NoSQL技术，内容包括：云计算和Hadoop、Amazon服务中的MapReduce套用、Hadoop套用下的大数据分析、NoSQL、HBase。本书不单纯地讲述理论和概念，而是基于目具体的工具和技术(Hadoop和NoSQL)，利用大量实际案例，通过实际的操作和套用来组织大数据处理和分析技术，有利于读者从工程套用的角度进行实际掌握和利用。适合相关专业的本科生、研究生和软体工程师学习。

目录信息

第1章 Hadoop的介绍和集群构建 2

1.1 Hadoop介绍 2

1.1.1 云计算和Hadoop 2

1.1.2 Hadoop的历史 4

1.2 Hadoop构建案例 6

1.2.1 欧美构建案例 6

1.2.2 韩国构建案例 7

1.3 构建Hadoop集群 8

1.3.1 分散式档案系统 8

1.3.2 构建Hadoop集群的準备事项 12

1.3.3 构建伪分散式 17

1.3.4 分散式集群（Cluster）构建 29

1.4 Hadoop界面 36

1.4.1 Hadoop分散式档案系统指令界面 36

1.5 总结 40

第2章 Hadoop分散式处理档案系统 41

2.1 Hadoop分散式档案系统的设计 42

2.2 概观Hadoop分散式档案系统的整体构造 43

2.3 Namenode的角色 44

2.3.1 元数据管理 44

2.3.2 元数据的安全保管——Edits和Fslmage档案及Secondary Namenode 49

2.3.3 Datanode管理 52

2.4 Datanode的角色 59

2.4.1 block管理 59

2.4.2 数据的複製和过程 61

2.4.3 Datanode添加 63

2.5 总结 65

第3章大数据和MapReduce 67

基于Hadoop的大数据分析和处理

基本信息

内容简介

目录信息

相关推荐