Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
中台数据工程教程
DeepSeek smallpond搅动大数据风云
DuckDB 走向分布式?DeepSeek 的 smallpond 涉足大数据DuckDB!降维打击传统大数据领域,搅动中台数据工程风云! DeepSeek 正在利用 smallpond(一种新的、简单的分布式计算方法)推动 DuckDB 超越其单
DeepSeek开源smallpond和3FS指南
你可能在 Twitter/X/LinkedIn 的炒作中偶然发现了smallpond。从DeepSeek这场炒作中,你可能已经得出结论,
uv:Python项目管理的终极利器
如果条件允许,一定要先试试uv。如果不行,再考虑其他方法。 这是一个帕累托最优的解决方案,因为它比纠结于该做什么更容易,而且你很少会后悔。实际上,使用它的成本很低,但它带来的价值却相当高。 帕累托(Par
DeepSeek采用DuckDB数据分析
DeepSeek 的smallpond项目使用 DuckDB 进行数据处理,点击标题见: 特征 由
DFLib:内存中的 Java DataFrame 库
DFLib 是一个开源纯 Java DataFrame 库。它非常适合编写数据转换、
pipefunc:数据DAG管道快速构建工具
一个 Python 库,旨在让构建和运行复杂的计算工作流变得异常快速和简单。如果您曾经处理过函数之间复杂的依赖关系,为并行化而苦苦挣扎,或者希望以更简单的方式
2024 年数据库:年度回顾
由Pavlo在卡内基梅隆大学(CMU)的博客上发表的文章,回顾了2024年数据库领域的重要事件和发展。 文章涵盖了数据库许可证变更、Databricks与Snowflake之间的竞争、DuckDB的流行以及一些数据库相关的收购和资金筹集事件。
Apache Accumulo 简介
在本教程中,我们讨论了 Apache Accumulo,这是一个多功能、可扩展的数据库,擅长处理具有复杂访问要求的海量数据集。 其独特的功能(例如单元级安全性、迭代器和灵活的数据模型)使其成为需要安全高效的数据管理(用于实时分析、安全数据处理或大规模数据存
Kafka可用作队列模型了
Kafka 一直在更新,推出了很多强大的新功能。在 4.0 版本中,Kafka 开始变得更像一个
幽默:Kafka一条条信息支撑着世界
AI工作流神器:Airflow中调用大模型
这个代码库包含了一个用于在Apache Airflow中操作大语言模型(LLMs)的软件开发工具包(SDK),它基于Pydantic AI构建。 这个工具让用户可以直接在Airflow工作流中调用大语言模型,并通过装饰器任务来协调智能代理的调用。<
Arrow+Go颠覆ETL:重新定义数据工程
几十年来,数据工程一直建立在从未为现代硬件设计的基础之上。传统的基于行的数据库、序列化数据格式和网络密集型工作流程对本应极快的数据移动和转换造成了人为的瓶颈。 即使在今天,大多数 ETL 管道仍然依赖于: 基于行的数据存储(PostgreS
事件溯源可作为AI大模型的创意工具
事件溯源是一种架构,它将系统中的每次变更都存储在不可变的事件日志中,而不仅仅是捕获最新状态,而是存储数据变更的意图。它不仅仅是记录过去的操作,更是保存数据的完整叙述。每一次创建、更新或删除都会成为事件历史记录中有意义的条目。通过按照事件在系统中发生的顺序重放这些事件,您可以轻松重建应用程序在任何时间
Spring Batch复合条目阅读器教程
在本文中,我们学习了如何实现和测试CompositeItemReader,它允许我们按特定顺序处理来自多个来源的数据。通过将读取器链接在一起,我们可以按特定顺序处理来自文件、数据库或其他来源的数据。 在
Apache Kylin简单教程
在本文中,我们探索了 Apache Kylin,这是一款专为大数据分析的极致规模和性能而构建的工具。它将 OLAP 建模的强大功能与分布式计算相结合,可在海量数据集中提供快速、可靠的洞察。 该平台拥有重要的组件和功能,包括流式传输支持、原生计算引擎、自动化
Spring Boot中用Elasticsearch导入CSV
在本教程中,我们将学习如何使用 Spring Boot 将数据从 CSV 文件导入 Elasticsearch。当我们需要从旧系统或外部来源迁移数据,或者准备测试数据集时,从 CSV 文件导入数据是一种常见的用例。 在本文中,我们介绍了如何使用三种方法将
数据工程中建议用图思维取代孤岛
一篇由Jack Vanlightly撰写的博客文章,标题为“Dismantling ELT: The Case for Graphs, Not Silos”。这篇文章探讨了数据架构中的ELT(提取、加载、转换)流程,以及它如何受到Conway定律的影响,导致软件开发和数据分析团队之间的隔阂。
.NET中将请求加入用户背景以实现跟踪
在ASP.NET Core里,咱们可以给请求追踪加点“用户背景user context”信息,这样就能更轻松地找到问题、搞懂用户在干嘛,还能让网站变得更好。 我来一步步教你们,咋在ASP.NET Core网站里给请求追踪加个用户背景。
上页
下页
关闭