题目

描述一下hdfs上传文件的流程

答案


  1. 由客户端 向 NameNode节点发出请求;

  2. NameNode 向Client返回可以可以存数据的 DataNode 这里遵循机架感应原则;

  3. 客户端 首先 根据返回的信息 先将 文件分块(Hadoop2.X版本 每一个block为 128M 而之前的版本为 64M;

  4. 然后通过 NameNode 返回的 DataNode 信息 直接发送给 DataNode 并且是 流式写入同时会复制到其他两台机器;

  5. dataNode 向 Client通信 表示已经传完 数据块 同时向NameNode报告

  6. 依照上面(4到5)的原理将 所有的数据块都上传结束 向 NameNode 报告 表明 已经传完所有的数据块 。

写文章

提问题

面试题