• 通过流处理,我们可以在数据可用时持续处理数据我们以事件流的形式从事件源(例如数据库)实时捕获数据,并将数据移动到目标系统(例如数据仓库和数据库)。 什么是事件?事件就是你将数据概念化的时候。我这么说是什么意思?考虑一下下面的
  • 了解流式数据基础结构的使用和滥用很重要。Apache Kafka是一个消息代理,在过去几年中迅速普及。消息代理中间件已经存在了很长时间。它们是一种数据存储,专门用于在生产者和使用者系统之间“缓冲”消息。Kafka之所以流行,是因为它是开源的并且能够扩展到大量消息。消息代理通常用于使数
  • 在自 2016 年以来,我们在 Mirakl 开始使用 Kafka 作为消息服务,以支持我们在微服务环境中的异步驱动架构。起初,Kafka 仅用于非关键服务,如电子邮件、审计或日志记录。这是一种安全的方法,因为我们对这项技术还没有完全的信心,尤其是我们对关系数据库的交易方面,这是处理 icon
  • icon
  • Yotpo使用Apache Kafka和Debezium为每分钟数百万条消息实施了高度可扩展且可靠的预定消息解决方案:实现大规模分布式系统并不容易,因为传统的数据库调度无法扩展。此外,在使用微服务架构时,它变得更加困难,因为您继承了所有分布式系统问题,例如数据不一致、双重写入 和 域 icon
  • CQRS(命令查询职责分离)的核心有一个简单的目标:将读取和写入分离为单独的模型。这个简单的想法可以采用多种形式,具体取决于使用它的上下文以及所使用的实现选择。这篇文章试图分析 CQRS 的各种形状,以及所有这些形状如何支持解耦读写的中心思想。世界变得复杂了。信息系统不再只是简单的 icon
  • 在本文中,我们将研究 icon
  • 消费驱动合同(Consumer Driven Contracts:CDC)是一种软件工程方法,能让团队以TDD风格设计其分布式架构。Spring Cloud Contract Swagger支持Swagger API规范的合同测试。 当从单体架构迁移到微服 icon
  • CDC(Change Data Capture) 是一个软件过程,它捕获源数据库中所做的更改( icon
  • 如何构建流数据管道以捕获 MySQL 数据库更改并通过 Debezium 和 Kafka 将它们流式传输到 Apache Pinot? icon
  • 在现代微服务驱动架构中,CDC 通过提供连接传统数据库与云原生、事件驱动架构的桥梁而获得了新的重要性。变更数据捕获 (CDC) 是一种数据集成模式,用于跟踪数据中何时以及发生了哪些变化,然后提醒其他必须响应这些变化的系统和服务。CDC 帮助维护所有依赖数据的系统的一致性和功能。 icon
  • 2022年会崛起的项目有: DBT:使用 dbt,数据团队直接在仓库内工作,为报告、ML 建模和操作工作流生成可信数据集。dbt 帮助数据团队像软件工程师一样 icon
  • Snowflake 和 Debezium 在现代数据堆栈中获得了当之无愧的地位,现在很容易找到有关使用这些技术的在线资源。在这篇博客中,我们更进一步,回顾了我们(在 Shippeo)使用 Debezium 近乎实时地将大规模数据复制到 Snowflake 中学到的经验教训。数据是 S icon
  • GoCardless 的 ETL 方法侧重于将数据视为 API,避开已经开始巩固的行业标准 ELT 现代数据仓库方法。 上游数据质量挑战在上游遛弯时发现,工程师在修改服务时没有意识到像删除字段这样简单的事情 icon
  • 它一个 mysql-to-json kafka 生产者,Maxwell 为您提供了事件溯源的一些好处,而无需重新构建整个平台。该应用程序读取 MySQL 二进制日志并将行更新作为 JSON 写入 Kafka、Kinesis 或其他流媒体平台。Maxwell 的操作开销很低,只需要 m icon