NoSQL数据库大比拼: Cassandra, HBase, MongoDB, Riak

NoSQL数据库大比拼: Cassandra, HBase, MongoDB, Riak一文提供了这四个NoSQL数据库读修改等操作的不同性能比较。是最新的一份全面报告。

该比较是以延迟和吞吐量为衡量指标，吞吐量越大，造成的延迟就越大，这是一对矛盾，那么哪个NOSQL数据库能够在这对矛盾中做得更好呢？

首先是大量数据Load加载，一亿的数据加载比较如下：

横坐标是吞吐量，纵坐标是延迟，吞吐量越大，延迟越小越好，图中HBase获胜。

读修改比例: 50/50，这是模拟典型电子商务应用的操作比例，重量修改操作下四个数据库的写能力比较图如下：

HBase 和 Cassandra 写性能方面遥遥领先。

HBase客户端配置为 AutoFlush关闭. 修改聚合在客户端buffer中，一旦缓冲满了，将异步追加写flushed，为了加速服务器端修改处理，启用延迟日志 flush。在flush阶段WAL edits保存在内存中。

Cassandra写可变数据到commit日志，然后内存in-memory Memtable表更新，这将会慢些，但是比HBase的延迟日志flush将更安全。

下图是各个数据库在读方面能力的性能比较图：

HBase 和 Cassandra不但写能力领域，在电子商务读写1:1情况下，读能力也很强，据此可以认为HBase 和 Cassandra适合读修改1:1的应用场合。
[该贴被banq于2012-11-03 18:17修改过]
[该贴被banq于2012-11-03 18:17修改过]

Workload B组的比较是以读为主的场景下，95%读，5%写，适合CMS内容管理等系统，下图是四个数据库在这种情况下读性能比较：

传统MYSQL在碎片分区下Sharded MySQL读性能最好，MongoDB因为内存映射文件(Memory-mapped files )类型的缓存名列第二，内存映射文件用户所有MongoDB的磁盘I/O； Cassandra的主键key和列缓存能够有利于频繁读取数据，特别是0.8版本增加了off-heap(超越JVM内部Heap)列缓存特性，显示它有相当的读取性能。主键key缓存保存每一列所有的Key在。因此不再需要查询SSTable索引文件，得益于行缓存，也不必从SSTable中读取行数据；而HBase的随机读取性能就慢了。

那么在以读为主的操作中，四个数据库的修改性能如何？