导读:现在大数据已经成为这个时代非常热门的话题。大数据运营商以自身用户数据为基础,利用云计算系统和数据模型解析,获取准确的用户数据。结合运营商大数据强大的用户分析能力和数据漏斗技术,对用户数据进行综合分析和数据采集技术。只要是互联网相关的行业,都会用到大数据。好学校后台有许多学员私聊小编表示-济南哪里有大数据开发培训课程?怎么样?小编与学员沟通过后,给学员推荐济南黑之猫it培训基地。接下来让我们一起来看看课程详情吧~
【课程名称】
大数据开发工程师
【课程大纲】
LINUX
基本命令
常见配置文件
文件操作命令和权限
安装软件
Shell脚本
AWK和sed脚本
内核加载流程
Docker介绍和操作
服务器调优项
分布式存储
Hadoop概述
HBase背景、简介以及系统架构和原理
HBase逻辑模型:行键、列族、timeStamp,HBase物理模型。
HBase环境搭建:伪分布式安装、完全分布式安装
HBase Shell 、HBase客户端API 、HBase表结构设计
HBase之Mapreduce、HDFS数据导入HBase
HBase二级索引、WAL机制、HBase集群迁移方案、导入方案、协处理器
HBase性能调优:JVM优化、查询优化、写优化、配置参数优化
Zookeeper
Zookeeper概述
Zookeeper系统架构
Zookeeper数据模型
Zookeeper写数据流程
Zookeeper安装部署
Zookeeper中shell操作
Zookeeper选举机制
Zookeeper监听操作
Zookeeper 分布式锁实践
Zookeeper应用场景
API操作
YARN
YARN介绍
YARN系统架构
YARN作业提交流程
YARN三种调度策略
YARN队列配置
YARN的Node Label机制
MapReduce
MapReduce介绍
MapReduce基础案例
MapReduce分片
MapReduce运行流程及shuftle
MapReduce案例
MapReduce相关参数
Scala
Scala介绍
Scala基础语法
数组和集合
泛型
隐式转换
IO操作
Spark
Spark概述、整体架构、Spark vs Mapreduce 、Spark vs Hive 、Spark Streaming vs Storm等
Spark 环境搭建:hive搭建、kafka搭建、安装apark
Spark 核心编程:基本工作原理、RDD弹性数据集
开发wordcount程序
Spark 创建RDD、各种算子操作(Transformation、Actions)、共享变量(广播、累加)
复杂一些的Spark编程:排名、二次排序、TopN分析
Spark架构分析:宽窄依赖、基于YARN的提交模式、SparkContext原理剖析、注册机制原理、Executor原理剖析、Task原理剖析、shuffer优化、BlockManager原理剖析、CacheManager原理剖析、Checkpoint原理剖析等
Spark Core调优:内存、判断耗时、优化数据结构、RDD与checkpoint、序列化、JVM、提高并行度、广播共享等
SparkSql
概述、Spark SQL与DataFrame 常用操作
RDD转换DataFrame的两种方式:反射方式、编程方式
通用的load和save操作
数据源:Parquet数据源、JSON数据源、Hive数据源、JDBC数据源
各种复杂案例
Spark Streaming
简介概述 与storm和spark对比、helloword
StreamingContext、DStream与Receiver
DStream基于数据源与HDFS的实时程序
DStream之Kafka数据源、Direct模式 、Transformation操作、与SparkSQL结合使用
Hive
Hive背景、介绍
Hive环境安装:内嵌模式、独立模式
Hive 的DDL
Hive 的 DML
Hive常见内置函数
Hive高级数据类型
Hive窗口函数
Hive自定义函数(UDF、UDAF、UDTF)
Hive 分区表、桶操作
Hive数据装载与导出
Hive动态分区、Hive高级查询、Hive索引、Hive视图
Hive之IO负载策略、HIVE sql优化、压缩、分布式缓存
数据采集
Sqoop介绍
Sqoop导入和导出命令
Sqoop增量和全量操作
Sqoop优化
Flume介绍
Flume离线采集、实时采集、多路采集
Flume拦截器
Flume优化
离线数仓
某大型电商项目数据仓库介绍
数据仓库规范
数据粒度
数据仓库模型以及分层
建模介绍
维度建模(维度建模和范式建模)
事实、星座模型
数据需求分析介绍
数据应用操作
数据抽取
数据清洗
数据转化
数据加载
调度
Azkaban介绍
Azkaban系统结构
Azkaban定时案例
Azkaban性能优化
【师资简介】
大数据资深讲师 张老师
8年工作经验+教学经验,毕业于北京航空航天大学,大数据培训讲师,在工作场景当中从开发工程师到项目经理以及架构师等等,参与过多个大型项目背景,关系型数据库以及大数据有深入的研究,关系型数据库Oracle理论体系结构均有非常深厚的功底以及大数据Hadoop和spark有深入的研究。
教课心得:
场景教学,学以致用,善于将复杂的技术简单化,能引导学生更快捷的学习方式
Java大数据讲师王老师
教学:12年工作经验+教学经验,毕业于山东理工大学,曾在互联网大厂担任项目经理,从入行开始研究的是JavaEE的工作流,擅长pringMVC、Spring、MYbatis等等框架,对前端vue、lonic更是深入研究。Hadoop大数据相关组件,如HBASE,hive,kafka,flink等等更是精通。
教课心得(特色):
条理清晰,环环相扣,逻辑鬼才,细节严谨,能感染学生,知识广博
【教学现场】
【行业优势】
1市场需求量大。
随着信息产业的快速发展,行业对人才的需求也在逐年扩大。据国之内权威统计,未来五年,我国对信息技术人才的需求总量将达到1500—2000万。以大数据分析为例,我国对大数据人才的需求正以每年20%的速度增长,每年新增人才近100万。
2就业面广。
一般来说,小规模的企业都有自己的IT部门。如果一个企业有比较大的信息量,数据库管理、企业信息管理等。都是必要的。同学们除了去新兴行业,还可以去这些比较有规模的行业。企业,作为信息化部门的重要岗位。
3高薪工作。
在市场经济高速发展的今天,大数据产业以其强劲的发展势头成为较具发展前景的高薪行业之一。大数据分析、大叔开发等大数据人才必将成为市场上的紧缺人才。工资也涨了。据相关数据显示,大数据行业是目前平均收入较高的行业。公司员工平均年薪超过100,000元,经验丰富的大数据工程师平均年薪普遍超过120,000元。
4升降速度快。
大数据人才需要一定的技术技能。但高校培养的人才与企业所需人才严重脱节,导致大数据人才短缺。因此,一个技术精湛的大数据技术工程师尤其受到用人单位的重视。
5.漫长的职业生涯。
很多人都说大数据工程师的职业生涯短暂,但这其实是一个误区。大数据工程师是全方位的人才,不受行业发展的限制,也不受年龄和体力的影响。医生和律师一样,会变老,更有经验,也更有价值。
6较强的职场适应能力。
大数据人才不仅是核心人才,更是一般人才。他们不怕任何地方,所以他们可以去任何一个快速增长的行业,这在更大程度之上增加了人才的价值,降低了职业风险。
7优良的工作环境。
伴随着新一轮全球产业结构调整和转移的浪潮,我国信息产业发展迅速,已成为继美国、日本后的第三大电子信息产业大国。北京、上海、广州、深圳和沿岸发达城市已成为我国信息产业的人口密集区。一般来说,从事信息产业的企业大多集中在写字楼或、省级软件科技园区。工作环境优越,生活设施齐全,同行业人才云集,有利于建立广泛的人脉网络,为自己的职业生涯打下坚实的基础。
【机构简介】
“黑之猫”是一种文化符号,代表着神秘和智慧,在很多文化中,黑猫也代表着好运、幸运以及智慧等,象征着公司追求高品质、高效率和高智能的发展理念以及更广阔的职业发展前景。未来,存在无限可能。
济南黑之猫智能科技有限公司是专注于IT技术培训公司,公司目前在北京、济南等地均设有校区,致力于为客户提供高品质、高效率、更全面的培训数据库开发/ETL开发/大数据开发/Java开发的培训课程。我们以技术为核心,以客户为中心,不断追求卓越的业务品质和客户体验,以帮助学习者更好地了解较新的技术趋势和市场需求。
我们拥有一支高素质、专业的团队,他们具备丰富的行业经验和专业技能以及各大高校毕业,确保了我们能够为客户提供较优质的服务。
企业愿景和使命:
黑之猫将坚守以下价值观:
-创新:不断创新,追求卓越。
-合作:互相信任、互相尊重,实现双赢。
-品质:以客户为中心,坚持高品质。
-服务:客户至上,追求卓越的客户体验。
-团队:相信、支持、尊重和激励团队成员。
【机构环境】