作者微信 bishe2022

代码功能演示视频在页面下方,请先观看;如需定制开发,联系页面右侧客服

大数据之Hadoo简介

试看: 

   01_尚硅谷_课程简介_大数据课程

   02_尚硅谷_课程简介_Hadoop课程

   03_尚硅谷_入门_大数据概念

   04_尚硅谷_入门_大数据特点(4V)

   05_尚硅谷_入门_大数据应用场景

   06_尚硅谷_入门_大数据发展前景

   更多视频请下载完整版hadoop


Hadoop框架主要用来解决海量数据的存储和分析计算问题。是大数据开发工程师必备技术之一。
课程特点:

本课程中你将学习到,Hadoop完全分布式集群搭建、Hadoop源码编译、HDFS的Shell操作、HDFS的API操作、HDFS的IO流操作、HDFS读写数据流程、NameNode和SecondaryNameNode工作机制、DataNode工作机制、集群节点动态服役和退役、HDFS2.x新特性、MapReduce编程规范、自定义序列化、自定义InputFormat、自定义OutputFormat、分区、排序、合并、分组、ReduceJoin、MapJoin、数据清洗、计数器、TopN案例、倒排索引案例、MapTask工作机制、ReduceTask工作机制、Shuffle工作机制、MapReduce工作流程、Job提交流程源码、MapReduce源码、数据压缩、Yarn工作机制、作业提交流程、YARN资源调度器、MapReduce企业优化、HDFS小文件企业优化、数据倾斜优化等。


视频课程

01_课程简介_大数据课程

02_课程简介_Hadoop课程

03_入门_大数据概念

05_入门_大数据应用场景

06_入门_大数据发展前景

07_入门_大数据部门业务流程分析

08_入门_大数据部门组织结构(重点)

09_Hadoop_是什么

10_Hadoop_发展历史

11_Hadoop_三大发行版本

13_Hadoop_1.x和2.x区别

14_Hadoop_组成

15_Hadoop_大数据技术生态体系

16_Hadoop_推荐系统框架图

17_环境搭建_虚拟机准备

18_环境搭建_JDK安装

19_环境搭建_Hadoop安装

20_环境搭建_Hadoop目录结构

21_环境搭建_Hadoop官网手册

22_本地模式_Grep官方案例

23_本地模式_WordCount官方案例

24_伪分布式_启动HDFS并运行MR程序

25_伪分布式_Log日志查看和NN格式化前强调

26_伪分布式_NameNode格式化注意事项

27_伪分布式_启动YARN并运行MR程序

28_伪分布式_配置历史服务器

29_伪分布式_配置日志聚集

30_伪分布式_配置文件说明

31_完全分布式_虚拟机环境准备

32_完全分布式_scp案例

33_完全分布式_rsync案例

34_完全分布式_集群分发脚本xsync

35_完全分布式_集群配置

36_完全分布式_集群单节点启动

37_完全分布式_集群ssh配置

38_完全分布式_集群群起

39_完全分布式_集群文件存储路径说明

40_完全分布式_集群启动停止方式总结

41_每日回顾

42_完全分布式_RM启动注意事项

43_完全分布式_Crondtab定时任务调度

44_完全分布式_集群时间同步

04_入门_大数据特点(4V)

45_Hadoop源码编译_意义

46_Hadoop源码编译_说明

47_Hadoop源码编译_具体流程

48_HDFS_课程介绍

49_HDFS_产生背景及定义

50_HDFS_优缺点

51_HDFS_组成架构

52_HDFS_块的大小设置

53_HDFS_Shell命令(开发重点)

54_HDFS_副本数设置

55_HDFS_客户端环境准备

56_HDFS_客户端环境测试

57_每日回顾

58_HDFS_文件上传_案例

59_HDFS_参数优先级说明_案例

60_HDFS_文件下载_案例

61_HDFS_文件夹删除_案例

62_HDFS_修改文件的名称_案例

63_HDFS_查看文件的详情_案例

64_HDFS_判断是文件还是文件夹_案例

65_HDFS_文件IO流上传_案例

66_HDFS_文件IO流下载操作_案例

67_HDFS_定位读取文件_案例

68_HDFS_写数据流程(面试重点)

69_HDFS_网络拓扑-节点距离计算

70_HDFS_机架感知-副本存储节点选择

71_HDFS_读数据流程(面试重点)

72_HDFS_NN和2NN工作机制(面试重点)

73_HDFS_Fsimage和Edits解析

74_HDFS_CheckPoint时间设置

75_HDFS_NN故障处理_案例

76_HDFS_安全模式

77_HDFS_集群安全模式_案例

78_HDFS_NN多目录配置_案例

79_每日回顾

80_HDFS_DN工作机制(面试重点)

81_HDFS_数据完整性

82_HDFS_掉线时限参数设置

83_HDFS_服役新节点_案例

84_HDFS_添加白名单_案例

85_HDFS_黑名单退役_案例

86_HDFS_DN多目录配置_案例

87_HDFS新特性_集群间数据拷贝

88_HDFS新特性_小文件归档案例

89_HDFS新特性_回收站案例

90_HDFS新特性_快照管理

91_MapReduce_课程介绍

92_MapReduce_概述

93_MapReduce_优缺点

94_MapReduce_核心思想

95_MapReduce_进程

96_MapReduce_官方案例源码解析和数据类型

97_MapReduce_编程规范

98_MapReduce_WordCount案例分析

99_MapReduce_WordCount案例Mapper

100_MapReduce_WordCount案例Reducer

101_MapReduce_WordCount案例Driver

102_MapReduce_WordCount案例测试

103_MapReduce_WordCount案例Debug调试

104_MapReduce_WordCount案例在集群上运行

105_每日回顾

106_MapReduce_序列化概述

107_MapReduce_序列化自定义步骤

108_MapReduce_序列化案例分析

109_MapReduce_序列化案例FlowBean

110_MapReduce_序列化案例Mapper

111_MapReduce_序列化案例Reducer

112_MapReduce_序列化案例Driver

113_MapReduce_序列化案例Debug调试

114_MapReduce_切片和MapTask并行度决定机制

115_MapReduce_Job提交流程源码解析

116_MapReduce_Job切片机制源码解析

117_MapReduce_FileInputFormat切片机制和配置参数

118_MapReduce_CombineTextInputFormat理论

119_MapReduce_CombineTextInputFormat案例

120_MapReduce_FileInputFormat实现类

121_MapReduce_TextInputFormat实现类

122_每日回顾

123_MapReduce_KeyValueTextInputFormat案例分析

12_Hadoop_优势(4高)

124_MapReduce_KeyValueTextInputFormat案例实现

125_MapReduce_NLineInputFormat案例分析

126_MapReduce_NLineInputFormat案例实现

127_MapReduce_自定义InputFormat步骤

128_MapReduce_自定义InputFormat案例

129_MapReduce_自定义InputFormat案例Debug

130_MapReduce_InputFormat实现类总结

131_MapReduce_工作流程(面试重点)

132_MapReduce_Shuffle机制(面试重点)

133_MapReduce_HashPartition默认分区

134_MapReduce_Partition分区案例

135_MapReduce_Partition分区案例总结

136_每日回顾

137_MapReduce_回顾分区

138_MapReduce_排序概述

139_MapReduce_排序分类

140_MapReduce_全排序案例分析

141_MapReduce_全排序案例FlowBean

142_MapReduce_全排序案例Mapper

143_MapReduce_全排序案例Mapper_已处理

144_MapReduce_全排序案例实现及测试

145_MapReduce_分区排序案例实现及测试

146_MapReduce_Debug调试思想

147_MapReduce_Combiner理论

148_MapReduce_Combiner案例实现

149_MapReduce_分组排序案例分析

150_MapReduce_分组排序案例OrderBean

151_MapReduce_分组排序案例Mapper

152_MapReduce_分组排序案例Driver

153_MapReduce_分组排序案例排序类

154_MapReduce_分组排序案例调试

155_MapReduce_分组排序案例扩展

156_MapReduce_MapTask工作机制(面试重点)

157_MapReduce_ReduceTask工作机制(面试重点)

158_MapReduce_ReduceTask个数设置

159_MapReduce_Shuffle机制(面试重点)

160_MapReduce_工作流程源码分析

161_MapReduce_OutPutFormat接口实现类

162_MapReduce_自定义OutputFormat案例分析

163_MapReduce_自定义OutputFormat案例实现

164_MapReduce_ReduceJoin理论

165_MapReduce_ReduceJoin案例分析

166_MapReduce_ReduceJoin案例TableBean

167_MapReduce_ReduceJoin案例Mapper

168_MapReduce_ReduceJoin案例Reduce

169_MapReduce_ReduceJoin案例Driver

170_MapReduce_ReduceJoin案例Debug和总结

171_MapReduce_MapJoin案例分析

172_MapReduce_MapJoin案例缓存文件处理

173_MapReduce_MapJoin案例测试

174_MapReduce_计数器应用

175_MapReduce_数据清洗案例

176_MapReduce_开发总结

177_压缩_概述

178_压缩_MR支持的压缩编码

179_压缩_方式选择

180_压缩_位置选择

181_压缩_参数设置

182_压缩_压缩案例

183_压缩_解压缩案例

184_压缩_Map和Reduce启用压缩案例

185_YARN_基本架构

186_YARN_工作机制

187_YARN_作业提交全流程

188_YARN_资源调度器

189_YARN_任务推测执行

190_企业调优_MR跑的慢的原因

191_企业调优_MR优化方法

192_企业调优_HDFS小文件处理

193_扩展案例_多Job串联案例分析

194_扩展案例_多Job串联案例第一个Job

195_扩展案例_多Job串联案例完成

196_扩展案例_TopN案例

197_扩展案例_找共同粉丝(学生版1)

198_扩展案例_找共同粉丝(学生版2)

199_Hadoop总结_企业真实面试题讲解

200_Hadoop总结_开发重点


Home