代码之家  ›  专栏  ›  技术社区  ›  Romain

找到正确的数据结构

  •  0
  • Romain  · 技术社区  · 6 年前

    我需要存储大约1000万个字符串,每个大约500个字符长。 我在AWS上,所以可以使用现有的结构。

    我的用例如下:

    • 从多个客户端读取/写入元素
    • 存储唯一元素
    • 检查它是否包含特定元素

    或者:


    • 获取随机元素
    • 删除特定元素 (这样我将从第一个结构中删除它,并将其放入同一类型的第二个结构中)

    • 维护“已处理”的布尔属性
    • 获取满足此属性的随机元素

    首先,我虽然使用了一个队列或类似的东西,因为新的字符串不断出现,但是队列不允许唯一性检查和随机访问。

    我检查的大多数数据库都不满足“get random element”函数的要求,对于我的用例来说似乎有点过分了,因为我只需要一两列。

    我也一直在考虑通过节点部署服务,并用JavaScript数组管理它。但是我不确定“检查它是否包含一个特定的元素”函数的数组中有这么多的元素。

    1 回复  |  直到 6 年前
        1
  •  0
  •   Romain    6 年前

    我最终选择使用redis set数据结构。它不能保证同一财产不会同时被两个不同的客户读取。但它允许在维护我的值的属性时随机查询。