模块 | 章节 | 授课模式 | 授课时长 |
---|---|---|---|
Python编程 | Python环境搭建及Python语法 | 边讲边练 | 4 |
Python Lambda、正则表达式、函数 | 边讲边练 | 4 | |
Python I/O及文件处理 | 边讲边练 | 4 | |
Python面向对象编程 | 边讲边练 | 4 | |
Python服务开发及数据库编程 | 边讲边练 | 4 | |
Python库介绍 | 边讲边练 | 4 | |
Python数据采集、整理及清洗 | 边讲边练 | 4 | |
Python数据扒取与初级整理 | 边讲边练 | 4 | |
搭建ELK环境及数据准备 | 边讲边练 | 4 | |
基于ELK实现数据全文查询 | 边讲边练 | 4 |
模块 | 章节 | 授课模式 | 授课时长 |
---|---|---|---|
Hadoop&Spark | 大数据概况及Hadoop生态系统 | 边讲边练 | 4 |
MapReduce原理及编程 | 边讲边练 | 4 | |
Apache Hive基础 | 边讲边练 | 4 | |
Apache Hive高级查询 | 边讲边练 | 4 | |
Apache Hive函数及性能优化 | 边讲边练 | 4 | |
Apache Sqoop介绍及数据迁移 | 边讲边练 | 4 | |
NoSQL综述及Apache HBase基础 | 边讲边练 | 4 | |
Apache HBase API介绍及性能优化 | 边讲边练 | 4 | |
Scala基础 | 边讲边练 | 4 | |
Scala高级 | 边讲边练 | 4 | |
Apache Spark基础 | 边讲边练 | 4 | |
Apache Spark分布式计算原理 | 边讲边练 | 4 | |
Spark SQL | 边讲边练 | 4 | |
基于Spark GraphX的图形数据分析 | 边讲边练 | 4 | |
项目练习 - 航班飞行网图分析 | 边讲边练 | 4 | |
PySpark及Jupyter Notebook集成环境搭建 | 边讲边练 | 4 | |
Hadoop数据模型及应用架构介绍 | 边讲边练 | 4 | |
项目练习 - 用户行为分析 | 边讲边练 | 4 | |
综合考试 | 4 | ||
考试难点讲解及复习 | 边讲边练 | 4 |
模块 | 章节 | 授课模式 | 授课时长 |
---|---|---|---|
项目实战:离线数据批处理 | 项目介绍及数据湖架构与建设 | 边讲边练 | 4 |
企业数据监管综述及实施 | 边讲边练 | 4 | |
日志数据探索 | 边讲边练 | 4 | |
Apache Kafka基础 | 边讲边练 | 4 | |
日志数据导入 | 边讲边练 | 4 | |
Apache NiFi基础 | 边讲边练 | 4 | |
日志数据流程(data flow)开发 | 边讲边练 | 4 | |
Apache NiFi高级 | 边讲边练 | 4 | |
日志数据流程(data flow)开发 | 边讲边练 | 4 | |
日志数据导入 | 边讲边练 | 4 | |
日志数据(Hive)ETL变换(1) | 边讲边练 | 4 | |
日志数据(Hive)ETL变换(2) | 边讲边练 | 4 | |
日志数据(Spark)ETL开发(1) | 边讲边练 | 4 | |
日志数据(Spark)ETL开发(2) | 边讲边练 | 4 | |
Apache Oozie架构及工作流程模型 | 边讲边练 | 4 | |
日志数据ETL工作流程 | 边讲边练 | 4 | |
机器学习及常用模型介绍 | 边讲边练 | 4 | |
建立日志推荐模型 | 边讲边练 | 4 | |
Canssandra基础及使用 | 边讲边练 | 4 | |
Cassandra与Hive,Spark的集成 | 边讲边练 | 4 | |
Redis基础及使用 | 边讲边练 | 4 | |
Redis与Hive,Spark的集成 | 边讲边练 | 4 | |
建立Tableau与Cassandra、Redis的连接,生成日志报表 | 边讲边练 | 4 | |
项目练习 - 舆情分析 (1) | 边讲边练 | 4 | |
项目练习 - 舆情分析 (2) | 边讲边练 | 4 |
模块 | 章节 | 授课模式 | 授课时长 |
---|---|---|---|
大数据系统管理与优化 | 基于Cloudera CDH的Hadoop集群安装和配置 | 线上自学 | |
Spark安装 | 线上自学 | ||
Cassandra、MongoDB及Redis安装 |
线上自学 | ||
Apache Kafka及NiFi安装 | 线上自学 | ||
提升系统的高可靠性 (Hign Availability) | 边讲边练 | 4 | |
提升Hive的高可靠性 | 边讲边练 | 4 | |
提升系统的安全性 - 认证(Authentication) | 边讲边练 | 4 | |
授权(Authorizatioin)及审计(Auditing) | 边讲边练 | 4 | |
数据保护 | 边讲边练 | 4 |
模块 | 章节 | 授课模式 | 授课时长 |
---|---|---|---|
项目实战:流数据实时计算 | 项目介绍及数据格式定义 | 边讲边练 | 4 |
Apache Kafka开发 | 边讲边练 | 4 | |
股票数据扒取 | 边讲边练 | 4 | |
基于Confluent的股票元数据管理及应用 | 边讲边练 | 4 | |
基于Spark Streaming的流数据处理和分析 | 边讲边练 | 4 | |
使用Spark Streaming实施股票数据的实施分析 | 边讲边练 | 4 | |
基于Apache Flink流数据处理及实时分析 | 边讲边练 | 4 | |
使用Apache Flink实施股票的实施分析 | 边讲边练 | 4 | |
Tableau数据可视化 | 边讲边练 | 4 | |
引入d3.js数据可视化 | 边讲边练 | 4 | |
d3.js数据可视化 | 边讲边练 | 4 | |
Python数据可视化 | 边讲边练 | 4 | |
Apache Flume基础及使用案例 | 边讲边练 | 4 | |
Apache Storm基础及使用案例 | 边讲边练 | 4 | |
Apache Storm开发 | 线上自学 | ||
项目总结&面试辅导 | 边讲边练 | 4 |
行业实战大咖 传授高薪之道
学制
3.5个月(全天授课)
招生对象
985、211院校学生、研究生学历学生(特别出色的普通本、专科学员需进行面试)
开班时间
本周六
华东地区席位热线
13721023247(微信同号)
/ 学习有门槛,入读需面试!/
硬件需求:CPU: i5四核 8G内存 固态硬盘