Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
Java批处理架构指南
Arroyo:基于Arrow和DataFusion的新SQL引擎
Arroyo 0.10 拥有一个使用 Apache Arrow 和 DataFusion 构建的全新 SQL 引擎。它更快、更小、更容易运行。 这篇文章将详细介绍 Arroyo 当前的实现以及为什么会发生变化,但简而言之: 性能:A
Kafka 中使用 @KafkaListener 批量消费消息
在本教程中,我们将讨论如何使用 Spring Kafka 库的@KafkaListener注释批量处理 Kafka 消息。 Kafka代理是一个中间件,可帮助持久保存来自源系统的消息。目标系统配置为定期轮询 Kafka 主题/队列,然后从中读取消息。
Spring Batch中通过多线程和异步处理提高性能
自计算机使用兴起以来,公司出于不同的目的始终依赖批处理数据,要么是在应用程序之间移动数据 (ETL),要么是进行一些需要很长时间才能实时完成的并行计算。 处理大量数据的挑战始终在于如何充分利用可用的计算资源,从而优化时间和成本。
高性能工作流引擎:DataBuilder与polaris
DataBuilder 框架是一个高级逻辑执行引擎,可用于执行多步骤工作流。该引擎目前为 Flipkart 的结账系统以及诊断和其他工作流程提供支持。您应该针对以下场景查看此框架: 多步骤工作流程执行,其中每个步骤都依赖于先前步骤生成的数据 执行可以跨越一个或多个请求
Spring Batch中管理长时间运行作业:解决连接问题
在 Spring Batch 中处理长时间运行的作业可能很棘手,尤其是在管理数据库连接和事务时。在我们关于 Developer's Coffee 的最新文章中,我们深入探讨了 Spring Batch 作业由于连接限制而超时的现实问题。 了解我们如
Spring Batch + JPA 处理 Excel 文件教程
在本文中,我们将演示如何使用 Spring Batch 从 Excel (.xls 或 .xlsx) 文件读取所有行并将其保存到 Spring Boot 应用程序中的数据库中。我们将介绍从读取 Excel 文件、将行转换为Entity实例、将这些实例保存到数据库、记录进度以及使用 cron 表达式安
Spring中实现持久化Quartz调度任务的指南
在本文中,我们探讨了两种持久化和恢复 Quartz 作业的方法。Quartz 内置的 JDBC 持久化功能提供了一个交钥匙解决方案,它会自动将作业和触发器存储在自己的模式中,并在应用程序重启后无缝地重新加载它们。 另一方面,自定义业务作业存储库使我们能够更
Spring Boot 只执行一次计划任务
在本文中,我们探讨了在 Spring Boot 应用程序中安排任务仅运行一次的解决方案。我们从最简单的选项开始,使用不带固定速率的@Scheduled注释。然后,我们转向更灵活的解决方案,例如使用TaskScheduler进行动态调度并创建确保任务仅执行一次的自定义触发器。
Rill:Go语言中并发+事务的批处理开源项目
Rill(名词:小流)是一个用于流式传输、并行处理和管道构建的综合 Go 工具包。它旨在减少样板文件并简化使用,使开发人员能够专注于核心逻辑,而不会因并发的复杂性而陷入困境。 通过通道转换、类型安全、批处理和错误处理实现并发。
如何在 Spring Batch 中运行多个作业
在本文中,我们探讨了使用 Spring Batch 运行多个作业的一些方法。通过理解本文中使用的基本示例,我们可以设计一个更高效、可扩展且更易于维护的批处理系统。 Spring Batch是一个强大的框架,通过提供可重用的组件和可靠的基础架构,可以轻松处理
使用 C# 和 EF Core 进行快速 SQL 批量插入
无论您是构建数据分析平台、迁移遗留系统还是引入大量新用户,都可能会需要在数据库中插入大量数据。 一张一张地放入唱片的感觉就像看着油漆慢慢变干一样。传统的方法行不通。 因此,了解使用 C# 和 EF Core 的快
pipefunc:数据DAG管道快速构建工具
一个 Python 库,旨在让构建和运行复杂的计算工作流变得异常快速和简单。如果您曾经处理过函数之间复杂的依赖关系,为并行化而苦苦挣扎,或者希望以更简单的方式
使用 UNNEST 将 Postgres INSERT 性能提高 50%
这篇文章由 Timescale 公司发布,讨论了在插入大量数据时,如何通过使用 UNNEST 函数来提高性能,有时甚至可以提高50%。 COPY 命令通常比 INSERT 更快,但许多开发者仍然偏好 INSERT,因为它更灵活,支持如 upsert
CoralRing:Java中用于IPC的超低延迟、批处理和并发队列
CoralRing 是堆外共享内存中的超低延迟、无锁、无垃圾、批处理和并发循环队列(环),用于使用内存映射文件在不同的 JVM 之间进行 Java 进程间通信 (IPC)。 它通过
DataLoader:化零为整解决数据N+1加载与查询性能瓶颈
在本文中,我们看到重复的数据库或服务调用很快就会成为瓶颈。而这正是DataLoader 的闪光点。它能够高效地批量处理和缓存调用,从而减少负载、缩短响应时间并简化代码。无论我们构建的是 GraphQL API、REST 端点还是微服务,引入DataLoader都能带来显著的提升。
Spring中实现面向写入的批量和批处理API
实现标准 REST API 涵盖了大多数典型用例。但是,基于 REST 的架构风格在处理任何批量或批处理操作时存在一些限制。 在本教程中,我们将学习如何在微服务中应用批量和批处理操作。此外,我们还将实现一些自定义的面向写入的批量和批处理 API。
MuleSoft:批处理的最佳实践
在当今数据驱动的世界中,组织经常需要高效、准确地处理大量数据。无论是迁移大量数据集、在系统之间同步记录,还是执行复杂的数据转换,批处理在确保这些任务可靠、按时完成方面都发挥着关键作用。 本文深入探讨了 Mule 4 中批处理的最佳实践,并提供了有关如何设计
Spring Batch中重启失败的作业并继续执行
Spring Batch 的默认可重启性支持从作业失败中进行稳健恢复,确保失败的作业可以从故障点恢复,而无需重新处理已完成的项目或丢失数据。 在本文中,我们创建了一个简单的作业来演示此重启功能。我们配置了一个作业来分块处理项目,模拟Item3发生故障。重启
下页
关闭