课程大纲

Big Data 概述:

  • 什么是 Big Data
  • 为什么 Big Data 越来越受欢迎
  • Big Data 案例研究
  • Big Data 特性
  • 要处理的解决方案Big Data。

Hadoop 及其元件:

  • 什么是 Hadoop 以及它的组成部分是什么。
  • Hadoop 架构及其特性 它可以处理的数据 /Process。
  • 简要介绍 Hadoop 历史、使用它的公司以及他们开始使用它的原因。
  • Hadoop 框架工作及其元件-详细解释。
  • 什么是 HDFS 和对 Hadoop 分散式文件系统的读取-写入。
  • 如何设置 Hadoop 不同模式的集群 - 独立/伪/多节点集群。

(这包括在 VirtualBox/KVM/VMware 中设置一个 Hadoop 集群,需要仔细研究的网路配置,运行 Hadoop 守护进程和测试集群)。

  • 什么是 Map Reduce 框架工作及其工作原理。
  • 在 Hadoop 集群上运行 Map Reduce 作业。
  • 了解 Hadoop 集群上下文中的 Replication、Mirroring 和 Rack 感知。

Hadoop 集群规划:

  • 如何规划Hadoop集群。
  • 了解硬体-软体以规划您的Hadoop集群。
  • 了解工作负载并规划集群以避免故障并执行最佳性能。

什么是 MapR 以及为什么选择 MapR :

  • MapR 及其体系结构概述。
  • 理解并操作MapR控制系统、MapR卷、快照和镜像。
  • 在 MapR 的上下文中规划集群。
  • MapR 与其他发行版和 Apache 的比较 Hadoop。
  • MapR 安装和集群部署。

集群设置和管理:

  • 管理服务、节点、快照、镜像卷和远端集群。
  • 了解和管理节点。
  • 了解 Hadoop 个元件,与 MapR 服务一起安装 Hadoop 个元件。
  • Accessing 集群上的数据,包括通过NFS管理服务和节点。
  • 通过使用卷管理数据,管理使用者和组,管理和分配节点角色,调试停用节点,集群管理和性能监控,配置/分析和监控指标以监控性能,配置和管理MapR安全性。
  • 了解和使用 MapR 表的 M7 本机存储。
  • 集群配置和优化以实现最佳性能。

集群升级并与其他设置集成:

  • 升级 MapR 的软体版本和升级类型。
  • 配置Mapr集群访问 HDFS 集群。
  • 在 Amazon Elastic MapReduce 上设置 MapR 集群。

以上所有主题都包括演示和练习课程,供学习者亲身体验该技术。

要求

  • FS 基础知识 Linux
  • 基本 Java
  • 了解 Apache Hadoop(推荐)
 28 小时

客户评论 (1)

即将举行的公开课程

课程分类