一、DataNode工作机制

直接看一张图：

它的工作流程是：

当DataNode启动后，必须向NameNode汇报自己的块信息，然后定期（6个小时）扫描、上报自己所有块的信息。块信息包括：数据、数据长度、校验和（即数据完整性）、时间戳
每个DataNode必须定期向NameNode汇报说：我还活着。这个过程叫做心跳，心跳每三秒一次；如果超过==10分钟+30秒== NameNode没有收到DataNode的心跳，就会认为DataNode挂掉了

DN向NN汇报当前块信息的时间间隔，默认6个小时，在hdfs-default.xml文件中有配置：

<property>
	<name>dfs.blockreport.intervalMsec</name>
	<value>21600000</value>
	<description>Determines block reporting interval in milliseconds.</description>
</property>

DN扫描自己自己节点块的信息的时间，默认6个小时，同样在hdfs-default.xml文件中有配置：

<property>
	<name>dfs.datanode.directoryscan.interval</name>
	<value>21600s</value>
	<description>Interval in seconds for Datanode to scan data
	directories and reconcile the difference between blocks in memory and on 
	the disk. Support multiple time unit suffix(case insensitive), as described
	in dfs.heartbeat.interval.
	</description>
</property>

如果想改变时间间隔，可以将上述两个配置信息配置到hdfs-site.xml中，然后分发配置重启hadoop集群，配置就会生效

二、数据完整性

数据完整性就是要保证数据在网络传输中不发生错误，所以要采取一些校验数据的手段，比如奇偶校验、CRC循环冗余校验等

比如我们要在网络中传输

第一个数据：
1000100
第二个数据：
1000101

奇偶校验就是：数所有的位中有多少个1，如果1的个数是偶数，那么就在末尾添加0；反之，如果1的个数是奇数，那么就在末尾添加1。对于上面的两个数据，他们应该各自加：

第一个数据：
1000100			|	0
第二个数据：
1000101			|	1

这样只要在传输过去之后，再次计算校验位，然后与携带过来的校验位进行对比，就可以知道数据有没有传输失误了。

但是，使用奇偶校验有一个很明显的问题，那就是如果两个位发生了改变，最后得出的校验位还是原来的数字。比如第一个数据：1000100在传输过程中，变成了1100110，数据发生了改变，但是校验位依旧是0，显然是有很大的问题的

所有Hadoop就采用了另外一种更安全的校验方法CRC循环冗余校验。这种校验法会随机生成一个多项式，然后把原始数据与多项式进行除法操作，最后把得出的余数一起发送过去。接收端再对原始数据除一下多项式，如果得出的余数和发送端一样，就没有任何问题。

三、掉线时限参数设置

在前文提到的心跳中，如果DataNode在10分钟+30秒内不向NameNode心跳一下，就会认为DataNode挂掉了

那么这个10分钟+30秒是怎么得来的呢？

它的计算公式是：

TimeOut = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval

看一下hdfs-default.xml的默认设置：其中dfs.namenode.heartbeat.recheck-interval的默认时间是300000毫秒即五分钟，dfs.heartbeat.interval的默认时间是3秒，于是超时时间就是10分钟+30秒

<property>
	 <name>dfs.namenode.heartbeat.recheck-interval</name>
	 <value>300000</value>
</property>
<property>
	 <name>dfs.heartbeat.interval</name>
	 <value>3s</value>
</property>

如果想要修改这些配置，可以把这些配置信息都配置到hdfs-site.xml中

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

13、DataNode工作机制.md

13、DataNode工作机制.md

一、DataNode工作机制

二、数据完整性

三、掉线时限参数设置

Files

13、DataNode工作机制.md

Latest commit

History

13、DataNode工作机制.md

File metadata and controls

一、DataNode工作机制

二、数据完整性

三、掉线时限参数设置