Java批处理架构指南

     

River:Go中快速可靠的事务性后台作业

22 2K

使用像 PostgreSQL 这样的关系数据库作为作业队列是一种可以接受的方法,一些公司在生产中成功使用了这种方法。虽然 Redis 等更传统的队列可能更适.

如何使用 Spring Boot Scheduler 计划和安排任务/作业?

1185 1 3K

有时我们会遇到这样一种情况,我们希望任务只在特定时间点执行或在特定时间间隔内重新执行。同时,我们的客户希望在特定时间以每小时、每天、每周、每月或什至其他方式.

基于Kubernetes的Spring Batch:大规模高效批处理

444 14K

在这篇博文中,我介绍了批处理开发人员或架构师在大规模设计和运行批处理应用程序时可能面临的一些挑战,并展示了 Spring Batch、Spring Boot.

批处理与事件流区别?

429

随着数据成为现代企业中越来越重要的一部分,组织经常发现自己需要处理大量数据。处理数据的两种常见方法是批处理和事件流。 .

Apache Flink与Kafka Streams区别? - Gunnar

1790

Apache Flink与Kafka Stream都能实现流处理,但在一些重要方面有所不同。 下面是从用户的角度出发的,不涉及实现细节: .

构建微服务分布式作业调度器 - Mesut

1354 1 6K
本文将帮助您以您可以配置的标准方式自动化您的工作。它还可以通过各种方式触发您的作业并执行您的业务代码。调度作业的方法有很多,包括cron 作业和Window.

Kestra 简介:开源编排和调度平台

2053 3K

公司建立数据管道以准备数据成分、提取见解并在内部和外部各方之间分发调查结果。处理各种海量数据的能力已成为推动业务成功的关键因素。然而,构建和管理数据流并不简.

使用Spring WebFlux和Reactive Kafka实现后端服务器发送事件

1827 1 4K

以非阻塞方式从基于 Kafka 的响应式 WebFlux REST 服务器到 Webflux 客户端的数据流。 以下设计的架构可用于: .

在 Data Lakehouse 中统一批处理和流处理

600 3K

最近,我们在 ALTEN 的一位客户表示希望开始从他们的操作系统中提取和集中数据。从分析的角度来看,他们的信息环境处于未开发状态。这为创建集中式分析平台留下.

批处理中的数据质量如何保证? - Weingarten

1034

下面是我在尼尔森工作时的实现,这在 Airflow 中使用 Soda 来实施数据质量检查的 .

大数据编排引擎历史回顾 - Ananth

1010 3K

我在 Hadoop/Bigdata 的早期阶段开始研究数据管道,当时大数据是一个流行词。 .

你应该使用 Apache Airflow 吗?

1321 5K
数据管道是任何公司数据基础架构中的关键组件。 许多公司用来管理其数据提取和转换的一种框架是 Airflow。无论是 100% 使用 Airflow 及.

Jellysmack如何将数据科学作业编排推向生产就绪水平?

808 4K
自从数据科学进入 IT 游戏并开始构建大量模型和项目以来,对工作编排的需求已经上升。由于 Jellysmack 的业务主要集中在帮助视频创作者在观众和质量方.

使用FUTURE 中的消息避免计划调度的批处理作业 - CodeOpinion

1147 1

有些人称它为cron作业,计划任务,或批处理作业。不管你怎么称呼它,它是一个定期运行的进程,查看数据库的状态,以确定对它发现的各种记录采取的一些具体行动。<.

使用benjamin-batchly实现Rust异步批处理 - alexheretic

525 2K

有时,与其同时做很多小事,不如将它们捆绑在一起,一次完成,作为一个批处理。所以在星期四早上的一个银行假期里,我很早就醒了(主要是因为我 1 岁男孩的尖叫声).

使用Kafka分区扩展Spring Batch大数据调度批处理 – Arnold

1021 1 21K

假设有一个您需要定期运行的流程,例如一天结束 (EOD)。假设这个流程中需要处理的数据量在不断增加。 最初,你可以做一个非常简单的 Spring 调度.

kestra: 无限可扩展的开源编排和调度平台

1538 1

Kestra 是一个无限可扩展的开源编排和调度平台,可以创建、运行、调度和监控数百万个复杂的管道。 任何类型的工作流程:工作流程可以.

Spring Boot调度任务源码与教程 - Thanh

868 7K

调度是指在特定时间或特定时间间隔后执行任务,以带来减少时间、减少资源、最大化吞吐量的好处。调度的诞生是为了处理诸如收集每日报告、每月报告或在一段时间后处理数.

类似Quartz的分布式Java后台作业计划程序:JobRunr

2681 5 4K

JobRunr 提供了一个统一的编程模型,以可靠的方式处理后台任务,并在共享主机、专用主机或 JVM 实例内的云(你好 Kubernetes)上运行。 .

使用Rqueue框架基于Redis和Spring Boot执行异步任务 -sonus21

2322 7K

在本文中,我们将学习如何使用Spring Boot 2.x和Redis执行异步任务,最后的代码演示了本文中描述的步骤。 一个典型的API调用包括五件事.

如何在不使用POJO代码的情况下创建Java批处理插入 -DZone Java

779 7K

POJO样板代码通常用于Java程序的各种功能中:无论是使用comparator(comparable的接口)进行比较,还是诸如在“通用数据结构”中存储大量.

使用Kubernetes竞争消费者模式扩展任务处理 - vinsguru

1058 6K
在分布式系统中,我们通过通过服务总线/消息队列传递消息来实现系统之间的松散耦合。有时,当消息的发送量很高时(即每单位时间传入的消息数大于每单位时间处理的消息.

使用Spring Boot调度WebSocket推送的教程和源码 - Baeldung

2478 4K

本教程介绍如何使用 .

基于Spring Batch的Spring Boot的教程 - Baeldung

3159 9K

在本文中,我们将学习如何使用Spring Boot创建一个简单的Spring Batch作业。首先,我们从定义一些基本配置开始。然后,我们将看到如何添加文件.

三种大数据流处理框架选择比较:Apache Kafka流、Apache Spark流和Apache Flink - quora

3777 2

所有这些框架(Kafka Streams,ksqlDB,Flink,Spark)对于特定的用例和需求都是很棒的。 决策选择真的很难,因为涉及许多因素。.

Netflix如何使用bulldozer从数据仓库批处理数据转移到键值存储?

1088 2K
Netflix拥有超过1.95亿用户,每天生成数PB的数据。数据科学家和工程师从我们的订户和视频中收集这些数据,并实施数据分析模型以发现客户行为,以最大程度.

使用Storm、Kafka和ElasticSearch处理实时数据 -javacodegeeks

1699 1
这是使用Storm,Kafka和ElasticSearch处理实时数据的文章和 .

如何在Spring中使用JobRunr实现后台作业? - Baeldung

3195 1 5K

在本教程中,我们将研究使用JobRunr在Java中进行分布式后台作业调度和处理,并将其与Spring集成。 .

建立流数据与批处理管道的7个最佳实践 – thenewstack

960 2K

企业正在从传感器,智能手机,IT设备,网站和其他非传统来源获取越来越多的数据,并实时处理这些数据以改善运营并更好地为客户服务。 数据通常来自多个来源,.