• 实时数据胜过慢速数据。几乎每个用例都是如此。然而,企业架构师使用 Lambda 架构构建新的基础架构,其中包括单独的批处理层和实时层。这篇博文探讨了为什么称为 Kappa 架构的单个实时管道更适合。迪斯尼、Shopify 和优步等公司的真实示例探索了Kappa的好处,但也展示了批处理如何在不
  • 通过在数据架构过程的早期解决关键考虑因素,您可以避免将来出现严重问题。构建合适的数据架构对于所有现代架构的长期成功至关重要。为了协助您的应用程序现代化过程,在构建或重新构建应用程序数据时,请遵循以下五个规则。 使用正确类型的数据库 icon
  • 什么是MapReduce?它是一种框架或编程模型,用于使用分布式编程在计算机集群上处理大型数据集。 什么是“Map”和“Reduce”?“Maps”和“Reduce icon
  • 在这篇博文中,我们将看到一些在找工作时被问到的常见和重复的大数据面试问题。1.定义大数据?“大数据”是指规模超出典型数据库软件工具捕获、存储、管理和分析能力的数据集。这里的数据大小是主观的,因为它会随着时间的推移而增加。  icon
  • 文字不足以说明数据的重要性以及将其转换为有助于改进决策的形式的需要。当您拥有合适的数据分析工具时,将原始数据转换为有助于管理层做出更好决策的形式并不是一项艰巨的任务。这就是为什么依靠良好的数据分析工具至关重要。关于这一点,请查看 2022 年面向专业人士的 10 大大型分析工具。 < icon
  • 将数据从数据库移动到机器学习软件,然后再返回数据库,数据科学家来回折腾到原点的唯一选择:数据库内机器学习是数据分析的发展方向,它对我们提供真正的预测分析和在我们收到数据时使数据可操作的能力产生了巨大的影响。让我们看看各个行业应用数据库内机器学习的一些方式及其产生的影响。 icon
  • Hadoop 是一个用于存储数据和运行应用程序的框架。为任何类型的数据提供大容量存储是其主要功能之一。此外,它具有强大的处理能力,因此它能够一次处理多个并发任务。 Hadoop 模块 Hadoop 分布式文件系统 (HDFS) icon
  • mobilewalla已经发布了一个新的#Opensource项目:Anovos,它可以用来创建功能设计一个高效的数据管道,从摄入到功能创建和存储。在Mobilew icon
  • 当您将遥测数据发送到 Honeycomb 时,Honeycomb 的基础架构需要先缓冲您的数据,然后再在我们的“检索器”列式存储数据库中进行处理。在 Honeycomb 的整个存在过程中,我们一直使用 Apache Kafka在我们的可观察性管道中执行此缓冲功能。在这篇博文中,我们将 icon
  • 您在创建MongoDB时想解决什么问题?我们曾经并且正在尝试构建我们作为开发人员一直想要的数据库。对于纯报告,SQL 和关系是很好的,但是在构建数据时总是需要一些不同的东西:使编码水平扩展的东西。MongoDB 早期的主要障碍 icon
  • 你能给我们举一些例子来说明 Hadoop 在实时环境中是如何使用的吗?假设我们有一个由 10 道选择题组成的考试,20 名学生参加了该考试。每个学生都会尝试每个问题。对于每个问题和每个答案选项,都会生成一个密钥。因此,我们为每个学生的所有问题和所有答 icon
  • Hadoop不是数据库,它是一种具有称为 HDFS 的文件系统的架构。数据存储在没有任何预定义容器的 HDFS 中。关系数据库将数据存储在预定义的容器中。 什么是大数据? icon
  • 生产 Hadoop 部署支持哪些操作系统?主要支持的操作系统是 Linux。但是,通过一些额外的软件,Hadoop可以部署在 Windows 上。namenode的作用是什么?namenode 是Ha icon
  • 什么是Hive?Hive是适用于 Hadoop 的数据仓库系统,有助于轻松进行数据汇总、即席查询以及对存储在 Hadoop 兼容文件系统中的大型数据集的分析。Hive 最初是在 Facebook 开发的。它现在是一个有许多贡献者的 icon
  • Spark for data Engineers 是一个Github存储库(点击标题),将为读者提供概述、代码示例和示例,以更好地处理 Spark。数据分析师、数据科学家、商业智能分析师和许多其他角色需要按需提供数据。与数据孤岛、许多分散的数据库、Excel 文件、CSV 文件、JS icon
  • Hadoop可以运行的三种模式是什么?Hadoop icon
  • Hadoop 是基于 JAVA 的框架,用于存储和高效处理大型数据集。换句话说,该工具是一组开源实用程序,以其巨大的处理能力促进海量数据的存储和处理。该技术允许多个设备分析数据集,而不是使用一台计算机来处理数据。Apache Hadoop 带有两个子组件,如下所示 -  icon