新書推薦:
《
偿还:债务与财富的阴暗面
》
售價:HK$
78.2
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:HK$
92.0
《
封建社会农民战争问题导论(光启文库)
》
售價:HK$
66.7
《
虚弱的反攻:开禧北伐
》
售價:HK$
92.0
《
泰山:一种中国信仰专论(法国汉学经典译丛)
》
售價:HK$
81.4
《
花外集斠箋
》
售價:HK$
151.0
《
有兽焉.8
》
售價:HK$
68.8
《
大学问·明清经济史讲稿
》
售價:HK$
70.8
編輯推薦:
如果你的组织即将开始进入大数据的世界,那么可能不仅需要决定Apache Hadoop这个平台是否适合使用,还需要决定Hadoop中哪些组件*适合完成你的任务。本书将帮助你更容易地完成这项工作。本书将Hadoop的生态系统分解为一个个简略的、容易理解的小段内容,以便读者可以快速理解Hadoop项目、子项目及其相关技术是如何一起工作的。
內容簡介:
本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。
安全、访问控制和审计。Sentry、Kerberos和Knox。
云计算和虚拟化。Serengeti、Docker和Whirr。
關於作者:
Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。
Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
目錄 :
前言 1
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11
13 YARN 13
14 Spark 15
第2章数据库及数据管理 17
21 Cassandra 19
22 HBase 21
23 Accumulo 24
24 Memcached 26
25 Blur 28
26 Solr 30
27 MongoDB 32
28 Hive 34
29 Spark SQL 前身是 Shark 36
210 Giraph 38
第3章序列化 41
31 Avro 43
32 JSON 46
33 Protocol Buffers protobuf 48
34 Parquet 50
第4章管理与监控 53
41 Ambari 54
42 HCatalog 56
43 Nagios 58
44 Puppet 59
45 Chef 61
46 ZooKeeper 63
47 Oozie 66
48 Ganglia 68
第5章分析辅助 69
51 MapReduce 接口69
52 分析库 70
53 Pig 72
54 Hadoop Streaming 74
55 Mahout 76
56 MLLib 78
57 Hadoop 图像处理接口(HIPI) 80
58 SpatialHadoop 81
第6章数据传输 83
61 Sqoop 85
62 Flume 87
63 DistCp 89
64 Storm 90
第7章安全、访问控制和审计 93
71 Sentry 95
72 Kerberos 97
73 Knox 99
第8章云计算和虚拟化 101
81 Serengeti 103
82 Docker105
83 Whirr 107