数据湖 vs 数据仓库 vs 数据库


对于外行来说,数据存储通常在传统数据库中处理。但是对于大数据,公司使用数据仓库和数据湖。
 
什么是数据库?
数据库是存储结构化数据的存储位置。我们通常会想到计算机上的数据库——保存数据,可以通过多种方式轻松访问。可以说,您可以将智能手机本身视为一个数据库,这要归功于它存储的有关您的所有数据。

对于所有组织,数据库的用例包括:

  • 为财务和其他数据创建报告
  • 分析相对较小的数据集
  • 自动化业务流程
  • 审核数据输入

流行数据库:

 
什么是数据仓库?
数据库的下一步是数据仓库。数据仓库是您从各种来源积累的数据的大型存储位置。几十年来,商业智能和数据发现/存储的基础依赖于数据仓库。它们特定的静态结构决定了您可以执行哪些数据分析。
作为跨团队或部门孤岛数据库共享数据和内容的一种方式,数据仓库在大中型企业中很受欢迎。数据仓库帮助组织变得更有效率。使用数据仓库的组织经常这样做来指导管理决策——所有那些你经常听到的“数据驱动”的决策。
提供数据仓库的热门公司包括:

  
什么是数据湖?
数据湖是一个大型存储库,它以原始格式保存大量原始数据,直到您需要它为止。数据湖利用了数据仓库的最大限制:它们更灵活的能力。
正如我们将在下面看到的,数据湖的用例通常仅限于数据科学研究和测试——因此数据湖的主要用户是数据科学家和工程师。例如,对于实际构建数据仓库的公司来说,数据湖是一个转储和临时存储所有数据的地方,直到数据仓库启动并运行。中小型组织可能几乎没有理由使用数据湖。
流行的数据湖公司有: