代码之家  ›  专栏  ›  技术社区  ›  Boolean

大型数据库的替代方案[关闭]

  •  2
  • Boolean  · 技术社区  · 14 年前

    我有一个数据库,其中的表在一个表中有一个月的数十亿行,我有过去5年的数据。我试图以所有可能的方式优化数据,但是延迟并没有减少。我知道有一些解决办法,如使用水平收缩和垂直收缩。但我不确定是否有任何开源实现以及进行切换所需的开发时间。有人有使用这种系统的经验吗?

    谢谢您。

    4 回复  |  直到 14 年前
        1
  •  5
  •   Will Hartung    14 年前

    没有用例,任何人都不能提出任何建议。当你有数据时, Sagan-esque

    所以,您需要清楚地知道您希望如何处理这些数据。如果答案是“一切”,那么你的表现会很慢,因为你不能优化“一切”。

    编辑:

    嗯,是哪一个?2还是3?结果集有多大?你需要全部5年的时间还是最后一个月的时间?你真的需要所有这些细节吗,或者可以总结一下吗?你需要分类吗?钥匙够了吗?数据多久更新一次?数据更新后需要多快才能联机?数据需要具备什么样的服务级别?24x7x7?95x5?旧数据是否正常?谁在使用数据?交互式用户?批量报告?是否导出到外部实体?

        2
  •  3
  •   S.Lott    14 年前

    阅读数据仓库…

    1. 在平面文件中捕获数据。做 加载数据库。

    2. 星形模式 建筑学。

    3. 编写程序来实现维度一致性;这些程序只将维度更改加载到数据库中。

    4. 编写程序,将选定的平面文件记录与维度副本一起加载到数据集市中。

    使用原始数据加载数据库。曾经。

        3
  •  1
  •   BillThor    14 年前

    Postgres支持 partioning 桌子。如果没有其他内容,请阅读他们的文档。回答威尔·哈顿的问题将有助于找到解决方案。

        4
  •  0
  •   MatthewMartin muthu    14 年前

    这是多少GB的数据?这让我想起了linkin的故事以及如何足够快地计算社交网络,他们必须运行记忆中的所有东西。根据SO播客,stackover本身运行在一个内存很大的服务器上,并且在任何时候都将大部分数据库存储在内存中。

    同时也提醒了我谷歌的问题,它需要定制软件和大量廉价机器协同工作。