Hadoop 核心组件与实现原理
文章目录
一、HDFS (Hadoop Distributed File System)
核心架构
HDFS采用主从架构,主要由以下组件构成:
-
NameNode:整个文件系统的"大脑"
- 管理文件系统命名空间
- 维护文件系统树及所有文件和目录的元数据
- 记录每个文件中各个数据块的位置信息
- 不存储实际数据,只存储元数据
-
DataNode:实际数据存储节点
- 存储和管理实际的数据块
- 定期向NameNode发送心跳和块报告
- 响应客户端的读写请求
- 执行数据块的创建、删除和复制等操作
-
Secondary NameNode:
- 定期合并NameNode的编辑日志和镜像文件