数据仓库正在消亡 - John Foley

22-08-30 banq

沃尔玛建立了一个成为业界热议的数据仓库,部分原因是它是世界上最大的数据仓库之一,还因为沃尔玛正在使用该系统进行市场购物篮分析、销售历史、库存和其他商业智能,这家零售商以超前的战略与供应商和合作伙伴分享了这些信息。
在过去的 25 年中,像沃尔玛这样的数据仓库(大型、集中的本地系统)一直是许多公司的首选模型。然而,那些老式企业数据仓库的鼎盛时期即将结束,或者已经结束。

如今,越来越多的企业正在投资于更新的云原生平台,这些平台提供更快的查询、自动扩展、计算和存储资源分离、内置 AI/ML 和多云可用性——通常成本更低,有时由云数据库供应商管理。

传统数据仓库的日子屈指可数。事实上,专家们多年来一直在预测数据仓库的消亡。但也许更准确地说,数据仓库正在被重新发明和改造。
该行业正在采用新的术语——数据云、数据湖等——来描述正在进行的转变。

数据仓库需要一个耗时的提取、转换和加载 (ETL) 过程来将数据从记录系统移动到数据仓库,然后数据将被规范化, 查询并获得答案。许多组织“发现这种依赖两个独立的洞察系统的范式是站不住脚的。”

以下数据仓库正走向衰亡:
  • 61% IBM DB2
  • 49% Cloudera
  • 41% Teradata


传统的数据仓库提供商知道他们的客户想要更新的云原生平台,他们正在尽快将他们的产品现代化以留在游戏中。
例如,甲骨文的自治数据仓库去年进行了重大升级。AWS 最近宣布推出其已有近 10 年历史的数据仓库平台 Amazon Redshift 的无服务器版本。
Teradata 在其老式数据仓库方面取得了长足的进步,现在可在 AWS、Google Cloud 和 Microsoft Azure 上使用。

毫无疑问,传统数据仓库长期以来一直为许多企业服务。鉴于庞大的安装基础和它们所代表的投资水平,它们不会完全消失。
但是,供应商正在为数据库迁移提供越来越多的工具和服务。您可以肯定,这些功能正在用于将 TB 和 PB 的数据从传统数据仓库转移到新一代的云原生替代方案。