数据工程三剑客:PostgreSQL+Apache Cassandra+Apache Kafka


JAXenter与开源数据平台公司 Instaclustr 的 Postgres 技术研究员 Robert Treat 聊了聊 PostgreSQL 的受欢迎程度、它的用例以及它与哪些开源技术配对。
 Postgres 最擅长的是以无与伦比的价格为您提供具有所有高级功能的企业级数据库以及极其灵活的开源许可。
开源数据库当前状态的一大优点是,您可以找到许多专门构建的解决方案,这些解决方案可以进行权衡以针对特定用例进行优化。举个例子,Postgres 有一些最好的全文搜索功能,你可以在 RDBMS 中找到,我们经常建议构建新应用程序的人应该“只使用 Postgres”进行全文搜索,直到他们了解这是否会成为一项关键任务服务。如果事实确实如此,那么您可以引入 Elasticsearch 并运行 Open Distro。类似地,对于 CDC 管道或构建消息代理之类的东西,您可以在 Postgres 中完成,但转向 Apache Kafka 之类的东西可能会容易得多。
围绕 PostgreSQL、Apache Cassandra 和 Apache Kafka 构建开源数据层已经越来越受欢迎——这是理所当然的。作为整体数据策略,这种开源三合会可以以专有解决方案的一小部分成本创建坚固的三脚凳。PostgreSQL 显然为结构化数据带来了特别先进的关系数据库功能。
Apache Cassandra 继续证明其作为企业信任的开源 NoSQL 数据库的强大功能(并且预计采用率只会随着 Cassandra 4.0 相对较快地实现全面可用性而增加)。然后,Apache Kafka 提供首屈一指的开源数据流处理功能。结合起来,这三种开源技术对它们为 IT 团队提供的数据骨干起到了特别补充的作用。而且——重要的是——这三个版本都在纯开源版本中运行得非常好,无需为开放核心或专有替代方案付出代价。