博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《Hadoop MapReduce实战手册》一导读
阅读量:5957 次
发布时间:2019-06-19

本文共 938 字,大约阅读时间需要 3 分钟。

q1

前 言

Hadoop MapReduce实战手册

本书目标是帮助读者学会处理大型的复杂数据集。本书虽从简单的例子开始,但仍然可以看到深入的内容。这是一本简单的一站式指南,传授如何完成复杂的事情。它以一种简单而直接的方式呈现了90个攻略,给出了一步步的指导和真实环境的应用示例。

本产品包括在Apache软件基金会()开发的软件。

本书涵盖的内容

第1章解释了如何以单点模式以及集群模式安装和运行Hadoop。

第2章介绍了一套高级的HDFS操作,在处理大规模数据时,无论是用Hadoop MapReduce还是用非MapReduce用例,这些操作都很有用。

第3章解释了如何改变Hadoop部署的配置和安全性,以及如何调试。

第4章介绍了几种高级的Hadoop MapReduce特性,这些特性将有助于你开发高度定制化的、高效的MapReduce应用程序。

第5章介绍了其他与Hadoop相关的项目,如HBase、Hive和Pig。

第6章解释了如何使用Hadoop来计算基本的统计分析信息。

第7章介绍几种可以与Apache Hadoop协同使用的工具和技术,让你可以进行大规模的搜索和索引。

第8章介绍了如果使用Hadoop实现复杂的算法,如聚类、推荐和关系发现。

第9章解释了如何使用Hadoop和Mahout处理海量文本数据集,以及如何使用Hadoop实现数据预处理和加载操作。

第10章解释了如何使用亚马逊弹性MapReduce(Elastic MapReduce,EMR)和Apache Whirr在云基础设施上部署和执行Hadoop MapReduce、Pig、Hive和HBase计算。

目 录

第1章

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
第2章
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
第3章 高级Hadoop MapReduce运维
第4章 开发复杂的Hadoop MapReduce应用程序
第5章 Hadoop生态系统
第6章 分析
第7章 搜索和索引
第8章 聚类、推荐和关系发现
第9章 海量文本数据处理
第10章 云端部署——在云上使用Hadoop

转载地址:http://vugxx.baihongyu.com/

你可能感兴趣的文章
Centos下基于Hadoop安装Spark(分布式)
查看>>
3D地图的定时高亮和点击事件(基于echarts)
查看>>
mysql开启binlog
查看>>
设置Eclipse编码方式
查看>>
分布式系统唯一ID生成方案汇总【转】
查看>>
并查集hdu1232
查看>>
Mysql 监视工具
查看>>
从前后端分离到GraphQL,携程如何用Node实现?\n
查看>>
Linux Namespace系列(09):利用Namespace创建一个简单可用的容器
查看>>
博客搬家了
查看>>
Python中使用ElementTree解析xml
查看>>
jquery 操作iframe、frameset
查看>>
解决vim中不能使用小键盘
查看>>
jenkins权限管理,实现不同用户组显示对应视图views中不同的jobs
查看>>
我的友情链接
查看>>
CentOS定时同步系统时间
查看>>
批量删除用户--Shell脚本
查看>>
如何辨别android开发包的安全性
查看>>
Eclipse Java @Override 报错
查看>>
知道双字节码, 如何获取汉字 - 回复 "pinezhou" 的问题
查看>>