#Java大数据架构文章排行榜

2021年数据库回顾 - OtterTune

21-12-30 1058 1 banq

对于数据库行业来说,这是疯狂的一年,随着年底的临近,在我们进入 2022 年时值得反思和评估。以下是一些亮点以及我对它们对数据库领域可能意味着什么的一些想法。   PostgreSQL 的统治地... 详细

面向银行和金融部门的Hadoop

21-12-30 932 1 banq

Hadoop 是用 Java 编写的基于 Apache 的开源框架。它是著名的大数据工具之一,它使用其文件系统 HDFS(Hadoop 分布式文件系统)提供分布式存储和使用 Map-Reduce 编... 详细

未来Hadoop还会有生命吗?

22-01-08 531 banq

在过去的几年里,Hadoop 得到了无数赞誉——Hadoop 是一个以大象命名的强大的、用于存储和处理数据的开源框架。许多在 Hadoop 生态系统中投入巨资的组织发现自己处于十字路口,想知... 详细

数据网格与Data Fabric的区别 - thenewstack

22-01-07 984 banq

Data Fabric和Data Mesh数据网格都认为:在物理上集中所有数据是徒劳的。他们都认识到数据量只会增长,而数据源只会成倍增加。 结果,这两者有时往往会混为一谈。 但是它们在理念和实施方面... 详细

使用WSL2在Windows 11上安装Hadoop

22-01-06 812 banq

在这篇文章中,我们将看到如何使用 WSL 在同一台 Windows 11 机器上安装完整的 Hadoop 环境。   安装依赖 您需要安装两个重要的依赖项才能使 Hadoop 正常工作... 详细

大数据领域的国外公司、产品和技术列表

22-01-04 621 banq

以下数据来自福布斯,“大数据景观”: - 日志数据应用程序:Splunk、Loggly、Sumo Logic - 垂直应用:Predictive Policing、BloomReach、At... 详细

Apache Oozie 教程:使用 Oozie 调度 Hadoop 作业

21-12-30 769 banq

在这个 Apache Oozie 教程博客中,我们将介绍: Apache Oozie 简介 Oozie 工作流 Oozie 协调员 Oozie 捆绑包 字数统计工作流作业  基于时间... 详细

Hadoop 3.0 中的新功能

21-12-29 437 banq

这篇“ Hadoop 3.0 的新特性”博客重点关注 Hadoop 3 中的预期变化,因为它仍处于 alpha 阶段。Apache 社区已经合并了许多更改,并且仍在处理其中的一些更改。因此,... 详细

安装 Hadoop:设置单节点 Hadoop 集群

21-12-29 533 banq

安装 Hadoop 有两种方式,即单节点和多节点。 单节点集群意味着只有一个DataNode在一台机器上运行和设置所有的NameNode、DataNode、ResourceManager和Nod... 详细

Hadoop YARN 架构

21-12-26 488 banq

Hadoop YARN代表又一个资源管理器,随着 Hadoop 2.x 的出现,YARN 成为 Hadoop 生态系统的一部分, YARN 管理集群环境中的资源,在 Hadoop 2.x 之... 详细

基于Hadoop的Apache Hudi 0.10 发布

21-12-26 603 banq

Apache Hudi 0.10 发布,Hadoop关联 http://www.linuxeden.com/a/96092 使用 Apache Hudi 在 Uber 构建大规模交易数据湖: ... 详细

关于Delta Lake的ACID事务机制简介

21-12-25 481 banq

近年来,随着大数据利用用例的多样化,需要为分布式存储添加更多功能。这几年诞生了几款OSS存储层SW,可以原样使用HDFS等分布式存储和Apache Spark等分布式处理框架,为分布式存储添加新功能... 详细

Apache Pig:您需要了解的有关Hadoop编程语言的所有信息

21-12-24 480 banq

Apache Hadoop 框架的 MapReduce 编程模型可以处理大量的大数据数据。然而,数据分析师并不总是理解这种范式。这就是将一个名为 Pig 的抽象添加到 Hadoop 的原因。... 详细

大数据面试问题

21-12-24 436 banq

在这篇博文中,我们将看到一些在找工作时被问到的常见和重复的大数据面试问题。 1.定义大数据? “大数据”是指规模超出典型数据库软件工具捕获、存储、管理和分析能力的数据集。这里的数据大小是主观的... 详细

Pig面试问题

21-12-23 412 banq

你能给我们举一些例子来说明 Hadoop 在实时环境中是如何使用的吗? 假设我们有一个由 10 道选择题组成的考试,20 名学生参加了该考试。每个学生都会尝试每个问题。对于每个问题和每... 详细

共有 199 上一页 1 2 3 4 5 ... 14 下一页