#Java大数据架构文章排行榜

Kappa架构取代Hadoop的Lambda架构成为主流 - Waehner

21-12-07 1140 1 banq

实时数据胜过慢速数据。几乎每个用例都是如此。然而,企业 架构 师使用 Lambda 架构构建新的基础架构,其中包括单独的批处理层和实时层。这篇博文探讨了为什么称为 Kappa 架构的单个实时管道... 详细

Ifood如何使用Golang实现每天消耗超过10亿条 Kafka 消息

21-12-22 724 1 banq

Ifood 它是一家巴西食品科技公司,每天交付超过100 万个订单,并且每年增长约 110%。作为一家食品技术公司,该平台的流量时间主要是在午餐和晚餐时间,而且在周末会更高。   我们有一个 ... 详细

热门 Splunk 管理面试问题及答案

21-12-23 424 banq

随着大数据在企业中越来越受欢迎,在 Splunk 的职业生涯是最负盛名的职业之一。对这个工具不是很熟悉的人可以参考下一节来获得关于这个工具的基本信息。 Splunk 简介 Splunk 是一个... 详细

MongoDB 面试题

21-12-23 493 banq

您在创建MongoDB时想解决什么问题? 我们曾经并且正在尝试构建我们作为开发人员一直想要的数据库。对于纯报告,SQL 和关系是很好的,但是在构建数据时总是需要一些不同的东西:使编码水平扩展的... 详细

Hadoop 管理员面试问题

21-12-23 298 banq

生产 Hadoop 部署支持哪些操作系统? 主要支持的操作系统是 Linux。但是,通过一些额外的软件,Hadoop可以部署在 Windows 上。 namenode的作用是什么?... 详细

Hadoop集群面试题

21-12-23 374 banq

Hadoop可以运行的三种模式是什么? Hadoop 可以运行的三种模式是: 1. 独立(本地)模式 2. 伪分布式模式 3. 完全分布式模式   独立(本地)模式有哪些特点?在独立模式下... 详细

Hadoop面试题之HDFS

21-12-23 359 banq

Hadoop不是数据库,它是一种具有称为 HDFS 的文件系统的 架构 。数据存储在没有任何预定义容器的 HDFS 中。 关系数据库将数据存储在预定义的容器中。   什么是大数据? . 详细

2022年学习数据科学的技巧:

21-12-23 310 banq

2022年学习数据科学的技巧: Python R NumPy Pandas Flask Scikit-Learn TensorFlow Big Data Linear Alge... 详细

2022年面向专业人士的 10 大大数据分析工具

21-12-22 603 banq

文字不足以说明数据的重要性以及将其转换为有助于改进决策的形式的需要。当您拥有合适的数据分析工具时,将原始数据转换为有助于管理层做出更好决策的形式并不是一项艰巨的任务。这就是为什么依靠良好的数据分析工... 详细

Hadoop大数据分布式处理系统简介

21-12-22 367 banq

Hadoop 是一个用于存储数据和运行应用程序的框架。为任何类型的数据提供大容量存储是其主要功能之一。此外,它具有强大的处理能力,因此它能够一次处理多个并发任务。   Hadoop 模块 ... 详细

Kafka-on-Pulsar 实现了偏移更好支持kafka - StreamNative

21-12-04 592 banq

KoP(Kafka on Pulsar) 2.8.0 支持连续偏移,现在可以投入生产。 默认情况下,Pulsar broker 只支持 Pulsar 协议。通过协议处理程序,Pulsar broke... 详细

Honeycomb使用Apache Kafka为数据摄取提供高可用性缓冲管道

21-12-04 592 banq

当您将遥测数据发送到 Honeycomb 时,Honeycomb 的基础 架构 需要先缓冲您的数据,然后再在我们的“检索器”列式存储数据库中进行处理。在 Honeycomb 的整个存在过程中,我... 详细

PostgreSQL与Elasticsearch和PGSync的实时数据集成 -Tolu

21-11-04 1316 banq

PGSync是一个变更数据捕获工具,用于将数据从Postgres转移到Elasticsearch。它允许你保留Postgres作为你的真实来源,并在Elasticsearch中公开结构化的非规范化文... 详细

如何使用传统数据库思维进行实时数据流分析? – thenewstack

21-10-19 629 banq

大多数流数据技术需要开发人员的思维方式不同于使用传统关系数据库的思维方式。但是现在,专注于时间序列数据库的初创公司Deephaven Data Labs发布了 Deephaven Community... 详细

构建企业CDC数据湖解决方案 -DZone

21-10-12 672 banq

CDC(Change Data Capture) 是一个软件过程,它捕获源数据库中所做的更改( SQLRF 30001" class='body_href' >DDL 和 DML )以同步另一... 详细

共有 199 上一页 1 2 3 4 5 6 ... 14 下一页