HDFS

HDFS的数据流（面试重点）

其中 ss.avi 有三个副本，每个副本有两块。

1）客户端通过 Distributed FileSystem 向 NameNode 请求下载文件，NameNode通过查询元数据，找到文件块所在的DataNode地址。

2）挑选一台 DataNode 服务器（就近原则），请求读取数据。若数据损坏，则选择一个副本来进行读取。

3）DataNode 开始传输数据给客户端（从磁盘里面读取数据输入流，以 Packet 为单位来做校验）。

4）客户端以 Packet 为单位接收，先在本地缓存，然后写入目标文件。

接下来就是 NameNode 和 SecondaryNameNode 相关（首先是工作机制然后是时间点设置再就是 NN 故障处理）

顺顺利利不挨批，收获多多~
屁屁明天也顺利

转载规则

《Hadoop-HDFS-数据流（文件读取）（HDFS系列七）》由文超采用知识共享署名 4.0 国际许可协议进行许可。

NameNode和SecondaryNameNode相关（面试重点）

2020-08-23 大数据

Hadoop-HDFS

HDFS数据流（文件写入、网络拓扑节点距离计算）

2020-08-20 大数据

Hadoop-HDFS