代码之家  ›  专栏  ›  技术社区  ›  kris

HDFS与HIVE分区

  •  5
  • kris  · 技术社区  · 7 年前

    这可能是一件简单的事情,但我正在努力找到答案。当数据加载到HDFS时,其将被分发并加载到多个节点。数据是分区和分布的。

    2 回复  |  直到 7 年前
        1
  •  2
  •   matz3    6 年前

    总结评论,对于Hadoop v1-v2.x:

        2
  •  1
  •   args    7 年前

    HDFS分区:主要处理节点上文件的存储。为了实现容错,文件跨集群复制(使用复制因子)

    Hive分区:这是Hive中的一种优化技术。 分区提供了有关数据如何存储在配置单元中以及如何读取数据的信息。