《Hadoop权威指南》,
当数据集的大小超过一台独立物理计算机的存储能力时,就有必要对它进行分区(partition)井存储到若干台单独的计算机上。管理网络中跨多台计算机存储的文件系统称为分布式文件系统(distributed filesystem)。
Hadoop 有一个称为HDFS 的分布式系统,全称为Hadoop Distributed Filesystem 。在非正式文档或旧文档以及配置文件中,有时也简称为DFS。
HDFS 的设计:
超大文件、流式数据访问、商用硬件、低时间延迟的数据访问、大量的小文件、每周户写入,任意修改文件
HDFS 的概念
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。