代码之家  ›  专栏  ›  技术社区  ›  Marco

读取模型分区密钥策略

  •  0
  • Marco  · 技术社区  · 6 年前

    我有一个文档集,看起来如下所示:

    enter image description here

    在特定地点。我看到两个可能的分区键,我们可以从中选择:

    1. SiteID/VIN:数据现在分布更加均匀,但这意味着每个逻辑分区只存储一个项。这是反模式吗?另外,为了支持我们的访问模式,我们需要使用跨分区查询。同样,数据集很小,所以这是一个问题吗?

    根据我所描述的,哪个分区键更有意义?

    任何其他建议将不胜感激!

    1 回复  |  直到 6 年前
        1
  •  0
  •   Nick Chapsas    6 年前

    您的第一个选项很有意义,可能是一个很好的分区关键字,但“可能没问题”这个词并不能真正培养信心。请记住,更改分区键的唯一方法是迁移到新集合。如果您可以冒这个风险,那么SiteId(我猜您将一直拥有)是一个很好的分区密钥。

    您还必须记住,您的RU在集合中的分区之间平均分配。