hdfs是什么意思?
Hadoop分布式文件系统指的是一种设计为在通用硬件上运行的分布式文件系统。它与现有的分布式文件系统有许多共同之处。但同时,它与其他分布式文件系统的区别也是显而易见的。HDFS是一个高度容错的系统,适合部署在廉价的机器上。
HDFS可以提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放松了一些POSIX约束,以达到流读取文件系统数据的目的。HDFS最初是作为Apache Nutch搜索引擎项目的基础设施开发的。HDFS是Apache Hadoop核心项目的一部分。
HDFS具有高容错性的特点,旨在部署在低成本的硬件上。此外,它提供了访问应用程序数据的高吞吐量,这适用于那些具有非常大的数据集的应用程序。HDFS放宽了POSIX的要求,因此文件系统中的数据可以以流的形式访问。