2021年数据库回顾 - OtterTune


对于数据库行业来说,这是疯狂的一年,随着年底的临近,在我们进入 2022 年时值得反思和评估。以下是一些亮点以及我对它们对数据库领域可能意味着什么的一些想法。
 
PostgreSQL 的统治地位
开发人员的传统观念已经转变:PostgreSQL 已成为新应用程序的首选。这是可靠的。它具有许多功能,并且还在不断添加更多功能。2010 年,PostgreSQL 开发团队改用更激进的发布计划,每年发布一个新的主要版本 (H/T Tomas Vondra )。当然,PostgreSQL 是开源的。
PostgreSQL兼容性是现在许多系统的显着特征。这种相容性通过支撑PostgreSQL的SQL方言(实现DuckDB),有线协议(QuestDB,数据HyPer),或整个前端(亚马逊极光,YugaByte,Yellowbrick)。大玩家纷纷加入。谷歌在 10 月份宣布他们在 Cloud Spanner 中添加了PostgreSQL 兼容性。同样在 10 月,亚马逊宣布了Babelfish功能,用于将 SQL Server 查询转换为 Aurora PostgreSQL。
数据库受欢迎程度的一种衡量标准是DB-Engine 排名。这个排名并不完美,分数也有些主观,但它是前 10 名系统的合理近似值。截至 2021 年 12 月,该排名显示,虽然 PostgreSQL 仍然是第四大最受欢迎的数据库(仅次于 Oracle、MySQL 和 MSSQL),但它在过去一年中缩小了与 MSSQL 的差距。
另一个需要考虑的趋势是 PostgreSQL 在在线社区中被提及的频率。最常提到的前 10 个 DBMS:

 PostgreSQL | 656
 MySQL | 317
 MongoDB | 266
 甲骨文| 222
 SQLite | 213
 Redis | 88
 EleaticSearch| 70
 Snowflake| 52
 DGraph | 46
 Neo4j | 42

它清楚地表明,在过去的一年里,人们提到 Postgres 的次数比其他系统都要多。经常有开发人员发帖询问他们的新应用程序使用什么 DBMS,社区的回应几乎总是 Postgres。
  
基准性能测速大比拼
今年有三场主要的街头斗争因基准结果而升温。

  • Databricks vs. Snowflake
    Databricks 宣布他们的新 Photon SQL 引擎在 100TB TPC-DS 中创造了新的世界纪录。Snowflake 予以回击,称其数据库速度提高了 2 倍,并且 Databricks 错误地运行了 Snowflake。Databricks 反驳,声称他们的 SQL 引擎提供了优于 Snowflake 的执行和性价比。
  • Rockset vs. Apache Druid vs. ClickHouse
    ClickHouse 出现了摇摆不定的情况,称与 Druid 和 Rockset 相比,它的成本效率更高。但没那么快:Imply对更新版本的 Druid 进行了测试并宣布获胜。Rockset 也加入了进来,称其在实时分析方面的性能优于其他两个。
  • ClickHouse 与 TimescaleDB暗斗的血腥:
    Timescale 加入了竞争。他们给出了自己的基准测试结果,并借此机会指出了 ClickHouse 技术的弱点。关于第三方基准测试的讨论在 Hacker News 上火了

 
大数据迎来大资金
自 2020 年下半年以来,价值至少 1 亿美元的风险投资轮次数量一直在稳步增加。 2020 年有 327 笔此类大型交易(仅不到 VC 交易总额的一半)。截至 2021 年 1 月,有超过 100 轮风险投资支持的投资轮,价值 1 亿美元或更多。
2021 年,大量投资资金投向了数据库公司。在运营数据库方面,CockroachDB 在今年年初以1.6亿美元的融资领跑了融资排行榜,然后在 2021 年 12 月又筹集了 2.78 亿美元。Yugabyte 获得了 1.88亿美元的 C 轮融资。PlanetScale为其托管版本的Vitess 筹集了 2000 万美元的 B轮融资。相对较老的 NoSQL 坚定的 DataStax 也在其 Cassandra 业务的风险投资中筹集了 3760 万美元。
尽管这些数量令人印象深刻,但分析数据库市场却更加火爆。TileDB于 2021 年 9 月筹集了一笔未公开的金额。 StarTree 从隐身状态中脱颖而出,并宣布了2400 万美元的融资,以将 Apache Pinot 商业化。Imply为基于 Apache Druid 的数据库服务筹集了 7000 万美元。SingleStore在 2021 年 9 月筹集了 8000 万美元,使他们离 IPO 又近了一步。今年年初,Starburst Data为其 Trino 系统(前身为 PrestoSQL)筹集了 1 亿美元。Firebolt 是另一家隐身的 DBMS 初创公司,宣布他们为其基于 ClickHouse 分支的新云数据仓库筹集了 1.27 亿美元。一家新公司 ClickHouse, Inc.筹集了惊人的 2.5 亿美元用于围绕该系统建立一家新公司(以及从 Yandex 获得使用 ClickHouse 名称的权利)。
但今年最大一轮融资的明显赢家是 Databricks,他在 2021 年 8 月筹集了高达 1.6 亿美元的资金,让其他所有人都大吃一惊。
我们正处于数据库的黄金时代。今天有很多很棒的选择。投资者正在寻找能够成为下一个类似Snowflake的 IPO 的数据库初创公司。
  
告别过去
遗憾的是,在过去的一年里,我们告别了一些数据库朋友。
  • ServiceNow 收购了 Swarm64。
    该公司最初是一家 FPGA 加速器,用于在 PostgreSQL 上运行分析工作负载。然后,他们转而使用扩展成为 PostgreSQL 的纯软件加速器。但他们未能获得吸引力,尤其是与其他资金充足的云数据仓库相比。在 ServiceNow 被收购之后,Swarm64 产品是否会继续存在仍然没有任何消息。
  • Splice Machine 破产了
    Splice 正在推出一种混合 (HTAP) DBMS,它结合了 HBase 用于操作工作负载和 Spark SQL 用于分析。然后,他们推动为操作/实时 ML 应用程序提供平台。但是,由于专用 OLTP 和 OLAP 系统的主导地位,一体化混合系统未能进入数据库市场。
  • 私募股权公司收购了 Cloudera
    自从过去十年的后半阶段,世界逐渐远离 MapReduce 和 Hadoop 技术以来,Cloudera 未能在云数据仓库市场上拥有同样的吸引力。Impala和Kudu 的大部分原始工程团队已经离开公司,尽管这些项目仍在开发中并发布新版本。该股自 2018 年以来已跌至低于其 IPO 价格。其新投资者能否扭转公司局面仍有待观察。