第1章 课程介绍&学习指南
1-1 课程介绍 (11:26)
1-2 学前必读(助你平稳踩坑,畅学无忧,课程学习与解决问题指南)
第2章 Redis入门
2-1 课程目录 (02:44)
2-2 Redis概述 (10:06)
2-3 Redis特性 (10:14)
2-4 Redis应用场景 (06:50)
2-5 Redis部署&服务启停&客户端连接 (17:09)
2-6 Redis多数据库特性 (07:04)
2-7 Redis基础命令的使用 (09:35)
2-8 Redis数据类型之string (15:14)
2-9 Redis数据类型之list (17:39)
2-10 Redis基本数据类型之set (13:53)
2-11 使用Jedis对Redis进行操作 (09:55)
2-12 Redis工具类开发 (04:54)
第3章 HBase入门
3-1 数据存储现状 (07:26)
3-2 HBase是什么 (05:58)
3-3 HBase在生态圈中的位置以及列式存储带来的好处 (07:49)
3-4 HBase的特点.mp4 (05:23)
3-5 HBase vs RDBMS vs HDFS.mp4 (05:15)
3-6 HBase的优势 (02:58)
3-7 HBase数据模型 (09:47)
3-8 JDK环境搭建 (04:19)
3-9 Hadoop环境部署(详解一个常见的错误解决方案) (14:41)
3-10 ZooKeeper环境部署 (03:32)
3-11 HBase环境部署 (09:01)
3-12 HBase shell DDL操作 (06:28)
3-13 HBase shell DML操作 (09:48)
3-14 HBase API编程之开发前置准备工作 (10:31)
3-15 HBase API编程之创建表以及查询表和所有列族 (07:32)
3-16 HBase API编程之添加和修改记录 (07:41)
3-17 HBase API编程之通过RowKey获取值 (05:47)
3-18 HBase API编程之Scan (08:39)
3-19 HBase API编程之Filter (06:09)
3-20 HBase API编程之总结 (02:27)
第4章 离线项目实战V1
4-1 课程目录 (03:03)
4-2 项目背景 (09:31)
4-3 项目处理流程.mp4 (11:03)
4-4 项目离线和实时架构图 (12:01)
4-5 明确架构图中每个步骤使用的技术以及职责所在 (06:32)
4-6 项目指标需求 (03:57)
4-7 功能开发之UserAgent解析(掌握如何获取技能) (16:46)
4-8 功能开发之IP解析思路 (02:12)
4-9 功能开发之Spark和HBase依赖整合 (03:39)
4-10 开发环境依赖使用说明 (09:16)
4-11 功能开发之解析日志成DataFrame并为DataFrame添加字段信息 (08:32)
4-12 功能开发之将DF内容转成HBase要存储的列 (15:03)
4-13 功能开发之整体ETL流程详解及如何传参设计 (10:20)
4-14 功能开发之创建HBase表 (13:54)
4-15 功能开发之HBase Rowkey设计_1 (10:07)
4-16 功能开发之完成ETL数据到HBase落地的全过程 (09:10)
4-17 功能开发之完成第一个指标的统计分析 (19:10)
4-18 功能开发之完成第二个指标的统计分析 (03:33)
4-19 性能优化之缓存的使用 (04:13)
4-20 功能开发之统计功能使用DataFrame API以及SQL API来完成 (06:33)
4-21 本章小结 (02:29)
4-22 【讨论题】关于Spark RDD核心算子的思考
第5章 离线项目实战优化
5-1 课程目录 (02:15)
5-2 Spark on YARN (12:02)
5-3 Linux时间获取 (04:13)
5-4 shell封装Spark作业提交脚本 (23:27)
5-5 将统计结果写入到MySQL中 (15:19)
5-6 统计结果写入到MySQL调优 (04:06)
5-7 Spark ETL到HBase优化之禁用WAL (18:29)
5-8 Spark ETL到HBase的HFile思路 (03:49)
5-9 Spark产生HFile文件格式准备工作 (10:55)
5-10 Spark产生HFile整个流程实现并总结 (14:06)
5-11 【讨论题】Spark OOM问题
第6章 实时项目实战
6-1 课程目录 (01:58)
6-2 项目背景 (02:31)
6-3 项目架构及处理流程 (05:01)
6-4 项目需求 (02:43)
6-5 开发环境准备及参数配置统一管理 (11:46)
6-6 Kafka部署及测试 (05:45)
6-7 Mock数据 (08:34)
6-8 发送数据到Kafka (12:56)
6-9 SparkStreaming对接Kafka数据 (06:18)
6-10 功能实现之每天的粒度统计..1 (15:54)
6-11 功能开发之调优 (04:36)
6-12 功能实现小结 (03:37)
6-13 功能实现之每小时统计及代码重构 (12:54)
6-14 SparkStreaming对接Kafka offset管理 (07:57)
6-15 【讨论题】SparkStreaming对接Kafka数据在项
第7章 初识Alluxio
7-1 课程目录 (02:05)
7-2 概述 (08:41)
7-3 Spark应用存在的问题分析 (08:39)
7-4 Alluxio能为我们带来什么 (08:05)
7-5 Alluxio特点 (05:46)
7-6 在Spark实战项目中引入Alluxio (07:28)
7-7 Alluxio部署 (11:29)
7-8 Alluxio文件系统命令行操作 (09:24)
7-9 Alluxio整合HDFS使用 (08:15)
7-10 Alluxio整合MapReduce使用 (08:07)
7-11 Alluxio整合Spark使用 (06:29)
7-12 Alluxio案例分享之在百度的使用 (11:36)
7-13 Alluxio案例分享之在去哪儿的应用 (11:52)
第8章 Spark优化
8-1 课程目录 (04:26)
8-2 调优之资源设置 (17:27)
8-3 调优之算子的合理选择 (09:47)
8-4 扩展之自定义排序一 (08:01)
8-5 扩展之自定义排序二(附带经典面试题) (07:14)
8-6 扩展之自定义排序(隐式转换) (04:27)
8-7 Spark Streaming调优之Kafka限速 (07:30)
8-8 Spark Streaming对接Kafka能真正做到仅消费一次吗 (03:29)
8-9 调优之序列化 (05:05)
8-10 调优之广播变量 (07:36)
8-11 【讨论题】数据倾斜的思考
第9章 (讨论群内直播内容分享)基于Spark定制ETL框架
9-1 Data Pipeline_x264 (06:19)
9-2 ETL中可能会遇到的问题_x264 (05:38)
9-3 (打标记处,3处听不清楚) Spark SQL DataSource API_x264 (06:40)
9-4 使用Spark SQL处理json数据_x264 (10:26)
9-5 基于Spark ETL框架的设计 (09:19)
9-6 基于Spark ETL框架的使用_x264 (06:45)
第10章 (讨论群内直播内容分享)Spark3新特性
10-1 Spark概述 (15:30)
10-2 Spark3.x新特性 (05:13)
10-3 DataSource API V2 (09:51)
10-4 动态分区裁剪 (06:34)
10-5 自适应查询执行 (08:57)
10-6 【讨论题】简历项目问题
第11章 【2022持续升级】自定义HBase外部数据源
11-1 课程目录 (01:39)
11-2 课程使用框架版本更新 (04:30)
11-3 通过Spark对接MySQL数据引出外部数据源的核心位置 (08:46)
11-4 外部数据源核心类剖析 (06:51)
11-5 JDBC外部数据源源码详解 (09:35)
11-6 Spark对接HBase数据源开发之主体轮廓 (08:32)
11-7 HBase数据准备及对接方案 (03:35)
11-8 Spark对接HBase数据源开发之参数解析 (06:40)
11-9 Spark对接HBase数据源开发之schema方法 (03:01)
11-10 Spark对接HBase数据源开发之buildScan方法 (06:11)
11-11 Spark对接HBase数据源开发之使用SQL方式 (01:21)
11-12 Spark对接HBase数据源开发之扩展 (04:58)
11-13 Spark对接HBase数据源开发之总结 (02:59)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。