代码之家  ›  专栏  ›  技术社区  ›  John Clayton

Cassandra是否适合用作主要数据存储?

  •  10
  • John Clayton  · 技术社区  · 14 年前

    我正在为即将到来的项目评估一个存储平台,并继续回到Cassandra。对于这个项目来说 任何 数据量不可接受。到目前为止,我们已经使用了一个关系数据库(Microsoft SQL Server),但是数据是如此的多样和庞大,以至于存储和查询都成为一个问题。

    Cassandra是否足够强大,可以用作主数据存储?还是应该只用于镜像现有数据以加快访问速度?

    2 回复  |  直到 13 年前
        1
  •  9
  •   jbellis    14 年前

    轶事:是的,Twitter、Digg、Ooyala、Simplegeo、Mahalo和其他人正在使用或转移到Cassandra进行主数据存储。( http://n2.nabble.com/Cassandra-users-survey-td4040068.html )

    技术上:是的;除了支持复制(包括到多个数据中心),每个cassandra节点都有一个fsync'd commit日志,以确保写操作持久;从那里,写操作变成sstable,在压缩之前是不可变的(将多个sstable组合到gc旧版本)。任何时候都支持快照,包括压缩前的自动快照。

        2
  •  4
  •   Irfan    13 年前

    是否为应用程序使用Cassandra完全取决于您的数据工作负载。Cassandra针对写密集型工作负载进行了优化,因此,它适用于需要插入大量数据的应用程序(如Facebook的基础设施日志记录信息)。

    但是,如果您需要快速的检索,插入速度不是问题,那么您也许应该看看HBase(它优化了读密集型工作负载)。