各有关单位:
互联网企业和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,何以解忧?Hadoop!我中心针对目前企事业单位信息技术研发人员对Hadoop大数据处理技术的紧迫需求,设计推出了Hadoop大型应用开发实战课程。
具体课程事宜如下:
一、课程目标
全面掌握Hadoop的架构原理和使用场景;
全程项目实战训练;
彻底掌握使用Hadoop进行MapReduce程序开发;
熟悉分布式计算领域的常用算法。
二、学习对象
软件工程师、数据库开发人员、网络后台开发人员、运维人员等。学员要求有一定的Java编程基础。
三、授课师资
王老师 国内早从事于Hadoop框架应用程序软件开发以及Hadoop解决方案专家。业界知名IT技术培训讲师、多家公司的技术顾问。
四、培训证书
本课程颁发双证,证书查询:www.ncie.gov.cn;www.zpedu.org
1、工业和信息化部人才交流中心颁发的《Hadoop架构师》证书。
2、中国信息化培训中心颁发的《Hadoop架构师》证书。
证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
五、培训费用
4500 元/人(含培训费、考试费、证书费、资料费、午餐) 食宿统一安排,费用自理。(请学员带二寸彩照2张—背面注明姓名,身份证复印件一张)。
六、具体课程安排
日程
|
模块单元
|
模块单元
|
第 一 天
|
第1个主题:Hadoop MapReduce 1. Hadoop JobTracker 剖析 2.Hadoop TaskTracker 剖析 3.Hadoop 任务提交流程剖析 第2个主题: Hadoop MapReduce Streaming编程 1. Hadoop Streaming 和 Java MapReduce Api 差异 2. 使用 MapReduce 实现数据库功能 第3个主题:MapReduce分布式程序 1. MapReduce流程 2.剖析一个MapReduce程序 3.基本MapReduceAPI 概念 4.驱动代码
|
5.Mapper 6.Reducer 7.API 使用Eclipse进行快速开发 8.新MapReduce API 第4个主题:Hadoop 核心代码剖析 1. Hadoop Mapper 类核心代码剖析 2. Hadoop Reducer 类核心代码剖析 第5个主题:HDFS分布式文件系统编程 1. Hadoop HDFS 剖析 2. Hadoop NameNode 剖析 3. Hadoop DataNode 剖析 4. hadoop I/O 操作 5. 使用Hadoop HDFS API对HDFS编程
|
第 二 天
|
第1个主题:Hadoop Mapreduce编程 1.ToolRunner介绍 2.使用MRUnit进行测试 3.利用Combiners来减少中间数据 4.使用Configure和Close方法来进行Map/Reduce设置和关闭 5.编写Partitioner来优化负载平衡 6.直接访问Hadoop分布式文件系统(HDFS) 7.使用分布式缓存(Distributed Cache) 第2个主题:MapReduce的优化 1. map优化 2. reduce优化 3. 小文件优化
|
第3个主题:MapReduce的任务调度 1. Queue调度的使用 2. 公平调度的使用 3. 能力调度的使用 第4个主题:MapReduce编程实战 1. Hadoop的join操作 2. Hadoop的二次排序 3. Hadoop的海量日志分析 第5个主题:flume+hadoop日志收集实战 1. flume介绍 2. flume核心组件讲解 3. flume自带的组件分析 4. flume二次开发实战
|
第 三 天
|
第1个主题:Hadoop的来源和动机 1.传统大规模系统存在的问题 2.对一种新的解决方案的需求 第2个主题:Hadoop安装和部署准备 Hadoop系统模块组件概述 Hadoop试验集群的部署结构 Hadoop 安装依赖关系 Hadoop 生产环境的部署结构 第3个主题:Hadoop集群安装和部署 Red hat Linux基础环境搭建 上机实验 Hadoop 单机系统版本 安装配置 上机实验 Hadoop 集群系统版本 安装和启动配置 上机实验 Hadoop 集群异常Debug 方法 Hadoop 集群简单测试方法 使用 Hadoop MapReduce Streaming 快速测试系统 第4个主题:Hadoop组件详解 Hadoop HDFS 基本结构 Hadoop HDFS 副本存放策略 Hadoop NameNode 详解 Hadoop SecondaryNameNode 详解 Hadoop DataNode 详解 Hadoop JobTracker 详解 Hadoop TaskTracker 详解 第5个主题:Hadoop集群配置详解 Hadoop core-site,hdfs-site,mapred-site 配置详解 Hadoop 高可用配置方法
|
第1个主题:Hadoop集群配置:机架感知,开启压缩和任务均衡 Hadoop 集群安装和开启LZO压缩 Hadoop 配置集群具备机架感知 Hadoop 集群开启公平任务调度器 Hadoop 集群开启能力任务调度器 第2个主题:Hadoop 集群维护与管理 查看集群状态 HDFS数据管理 Mapreduce 任务管理 HDFS安全模式 模拟集群Namenode,jobtrack失效 添加删除节点 数据平衡 文件数据跨集群拷贝 集群升级 第3个主题:Hadoop 集群规划和测试 集群规划(硬件,系统,网络) 集群性能测试 第4个主题:Hadoop 集群监控和运维 1. 使用Ganglia 监控Hadoop集群 2. 使用Cacti 监控操作系统 第5个主题:Hadoop HDFS高可用 Hadoop 元数据NFS备份方案 Hadoop SecondaryNameNode备份方案 Hadoop CheckpointNode备份方案 Hadoop BackupNode备份方案 Hadoop Cloudera HA Namenode 方案
|