优惠价 ¥9980.00 ¥16800
支持花呗 / 支持信用卡 ¥16800
Hadoop生态技术是大数据开发人员必学、必掌握、企业中必用的核心技术,比如HDFS、Yarn、MR、Hive、HBase、FLume、Sqoop、Oozie等, 本阶段课程从安装部署、架构原理、代码开发、源码与调优、项目架构与实战等多方位精彩呈现
全流程从 0 到 1 一步步带你完成整个大数据项目实战并呈现分析结果
1、掌握企业中大数据项目的经典架构设计和技术选型方案
2、了解一个大数据项目的所需要的资源如何规划
3、掌握Hadoop生态技术的各个原理和安装部署
4、掌握基于分布式集群环境的数据采集、存储、处理、服务发布、分析、大屏展示等技术
4、掌握Hadoop/Hive/HBase/Flume/Kafka/Zookeeper/Hue/Spark/WebSocket等技术在项目中的具体应用
深入核心,掌握高级开发、调优等技术
1、掌握MR高级编程,如二次排序、Join、Shuffle调优,这个非常重要,
直接影响后面Spark核心计算引擎的学习。
2、掌握Hive数据仓库原理、数据压缩、调优及案例实战。
3、掌握HBase的数据迁移、压缩、与MR集成数据处理
4、掌握Sqoop与业务数据库之间的数据采集与同步技术
5、掌握Oozie的工作流调度,在有规模的企业或者大数据项目中,数据处理工作流服务缺一不可
6、在【零基础】大数据项目实战课程的基础之上,再次通过企业项目案例对核心技术深入应用和讲解
业界对海量数据的分析处理,离不开这个三个计算引擎,这个阶段我们提供了海量的内容和案例实战来讲解,让同学们 达到完全掌握的水平,因为这个三个非常重要
基于Storm的熟练应用完成天猫双十一数据交易处理大数据项目
1、掌握Storm的整体架构、原理与应用
2、完成核心API的功能扩展于开发
3、掌握基于Storm/HBase/Kafka对实时业务的处理的架构和技术方案
4、跟随课程实战内容,一步步完成对天猫双十一大屏项目的实时数据业务的开发
5、掌握商业级别的数据分析大屏开发与数据传输协议的应用
掌握基于Spark的批/流大数据处理技术
1、Spark分布式安装部署、编程模型
2、Spark Core原理与实战
3、Spark Streaming准实时数据开发处理与案例实战
4、Spark SQL批量数据分析与案例实战
5、Structured Streaming高级应用与项目实战
6、Spark与Hadoop/Hive/HBase集成实战
掌握业界最具流行的批/流一体大数据处理技术
1、Flink分布式安装部署、编程模型
2、Flink DataStream算子应用与开发
3、语义/分布式缓存/广播变量/Window&WaterMark/Function/状态等核心应用于实战
4、FLink SQL开发与实战
5、Flink CEP核心应用与实战
6、项目中重点与外服务集成:Kafka/Hive/HBase/MySQL/ElasticSearch
掌握人工智能推荐业务中的算法知识:如内容推荐、用户画像、协同过滤、机器学习等, 这个是大数据开发工程师面试中非常加分的技术点,我们通过算法原理、数学模型、Spark机器学习源码剖析、案例实战等多种方式,让同学完全掌握并到达推荐系统设计与项目实战的水平
掌握企业常用的推荐算法,结合大数据技术完成推荐系统的设计与开发
1、掌握基于ELK + HBase的企业级项目实战
2、掌握基于内容的推荐算法与应用实战
3、掌握用户画像数据模型的构建
3、掌握协同过滤中基于近邻统计(余弦相似度、修改余弦、Peason)算法:数学模型 + Spark算法应用/源码剖析/案例实战
4、掌握协同过滤算法基于模型(SVD、ALS)等算法:数学模型 + Spark算法应用/源码剖析/案例实战
5、掌握基于关联规则算法:(Apriori、FP-growth)原理/案例实战
掌握企业大数据平台整体的构建实施能力,比如集群资源怎么规划、平台服务如何监控与管理等一系列的问题基于本课程做了全面的讲解
用手把手实战的方式带你一步步构建企业大数据平台的监控与管理
1、掌握企业大数据平台集群规划方案
2、掌握企业大数据平台架构设计方案
3、掌握企业大数据平台集群环境的配置要素
3、掌握企业大数据研发yum源构建
4、掌握CM从0到1的全方位实施步骤
5、掌握基于CM的企业大数据平台服务监控与管理