hadoop的HDFS文件系统

一，NameNode 元数据节点：管理文件系统

secondary namenode从元数据节点：元数据节点的别用节点

二，DataNode 数据节点：存储数据的地方

1）客户端向其请求读取或写入文件,元数据节点发起

2）周期性的想元数据节点回报当前存储的数据快信息

三，Block数据块：最基本的存储单位，默认64m,当一个文件大小小于一个数据块的大小时，并不会占用整个数据块的空间

write
1），Client向NameNode发起文件写入的请求。
2），NameNode根据文件大小和文件块配置情况，返回给Client它所管理部分DataNode的信息。
30,Client将文件划分为多个Block，根据DataNode的地址信息，按顺序写入到每一个DataNode块中。

read
1),Client向NameNode发起文件读取的请求。
2),NameNode返回文件存储的DataNode的信息。
3),Client读取文件信息。

简单操作：

当前HDFS的基本信息
$:hadoop dfsadmin -report

Configured Capacity: 15217328128 (14.17 GB)
Present Capacity: 8593608704 (8 GB)
DFS Remaining: 8593297408 (8 GB)
DFS Used: 311296 (304 KB)
DFS Used%: 0%
Under replicated blocks: 1
Blocks with corrupt replicas: 0
Missing blocks: 0

-------------------------------------------------
Datanodes available: 1 (1 total, 0 dead)

Name: 127.0.0.1:50010
Decommission Status : Normal
Configured Capacity: 15217328128 (14.17 GB)
DFS Used: 311296 (304 KB)
Non DFS Used: 6623719424 (6.17 GB)
DFS Remaining: 8593297408(8 GB)
DFS Used%: 0%
DFS Remaining%: 56.47%
Last contact: Tue Dec 11 01:16:30 CST 2012

列出HDFS的文件

$；hadoop fs -ls

Found 2 items
-rw-r--r-- 3 sina supergroup 13 2012-12-05 01:43 /user/demo.txt
drwxr-xr-x - sina supergroup 0 2012-11-18 15:17 /user/docs

cat；

$ hadoop fs -cat /user/demo.txt
test-测试