[toc]
CentOS7中用Ambari快速搭建大数据平台
公司的产品是基于大数据平台的,近期要做公司产品私有化部署,因此学习一下 Ambari
本文参考地址 原文链接
1.Ambari简介
Ambari是什么
Ambari 是创建、管理、监视 Hadoop 的集群的软件。这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper ,Spark ,Flink ,Flume ,Oozie 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具。 Ambari 现在所支持的平台组件也越来越多,例如流行的 Spark,Storm 等计算框架,以及资源调度平台 YARN 等,我们都能轻松地通过 Ambari 来进行部署,为想构建大数据平台的初学者提供了很大的便捷。
Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server
和 Ambari Agent
。简单来说,用户通过 Ambari Server
通知 Ambari Agent
安装对应的软件;Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server
,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护。
Ambari
基于Web的工具,支持Apache Hadoop集群的创建、管理和监控。
HDP
包含了hadoop生态系统的所有软件项目,比如HBase、Zookeeper、Hive
、Pig等等。
HDP-UTILS
工具类库。
HDP-GPL
LZO压缩库软件包存储在单独的HDP-GPL存储库中。
Ambari安装说明
Ambari类似于Ansible,并没有明确的 master/slave 之分