本文共 938 字,大约阅读时间需要 3 分钟。
Hadoop MapReduce实战手册
本书目标是帮助读者学会处理大型的复杂数据集。本书虽从简单的例子开始,但仍然可以看到深入的内容。这是一本简单的一站式指南,传授如何完成复杂的事情。它以一种简单而直接的方式呈现了90个攻略,给出了一步步的指导和真实环境的应用示例。本产品包括在Apache软件基金会()开发的软件。
本书涵盖的内容
第1章解释了如何以单点模式以及集群模式安装和运行Hadoop。第2章介绍了一套高级的HDFS操作,在处理大规模数据时,无论是用Hadoop MapReduce还是用非MapReduce用例,这些操作都很有用。
第3章解释了如何改变Hadoop部署的配置和安全性,以及如何调试。
第4章介绍了几种高级的Hadoop MapReduce特性,这些特性将有助于你开发高度定制化的、高效的MapReduce应用程序。
第5章介绍了其他与Hadoop相关的项目,如HBase、Hive和Pig。
第6章解释了如何使用Hadoop来计算基本的统计分析信息。
第7章介绍几种可以与Apache Hadoop协同使用的工具和技术,让你可以进行大规模的搜索和索引。
第8章介绍了如果使用Hadoop实现复杂的算法,如聚类、推荐和关系发现。
第9章解释了如何使用Hadoop和Mahout处理海量文本数据集,以及如何使用Hadoop实现数据预处理和加载操作。
第10章解释了如何使用亚马逊弹性MapReduce(Elastic MapReduce,EMR)和Apache Whirr在云基础设施上部署和执行Hadoop MapReduce、Pig、Hive和HBase计算。
第1章
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 第2章 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 第3章 高级Hadoop MapReduce运维第4章 开发复杂的Hadoop MapReduce应用程序第5章 Hadoop生态系统第6章 分析第7章 搜索和索引第8章 聚类、推荐和关系发现第9章 海量文本数据处理第10章 云端部署——在云上使用Hadoop转载地址:http://vugxx.baihongyu.com/