#hadoop

实时流处理框架Apache Flink简介

15-05-08 9468 4 banq

如今流处理越来越流行,例如Apache Kafka, Apache Samza, Apache Storm, Apache Spark的Streaming模块等等,云服务还有类似Google Clou... 详细

Hadoop与Spark等数据处理系统哪个是最好的?

15-04-28 2 2150 2 banq

如今我们拥有广泛的数据处理系统选择:Hadoop, Spark, Naiad, PowerGraph, Metis 和 GraphChi 等,这些不同框架的最佳性能其实高度依赖于高阶的工作流程,其次,... 详细

优步大数据平台处理100多PB数据却只有分分钟延迟!

18-10-19 1812 2 banq

优步致力于在全球市场上提供更安全,更可靠的运输服务。为实现这一目标,优步在很大程度上依赖于在各个层面制定数据驱动的决策,从预测高流量事件期间的需求到识别到解决我们的驾驶员 - 合作伙伴注册流程中的瓶... 详细

Apche Spark的命运

15-08-20 2034 1 banq

Spark取代了MapReduce,同样逻辑,什么会取代Spark? Apache Spark is doomed 文章提出了自己的看法。 Spark将数据装入内存in-memory, 比Ma... 详细

Hadoop生态系统中各种组件介绍 - theinsaneapp

20-10-21 228 banq

Hadoop生态系统是一套可以共同解决大数据问题的服务。四个核心组件是MapReduce,YARN,HDFS和Common。让我们详细讨论这个话题。在此之前,我们将列出大数据生态系统中使用的所有组件... 详细

Apache Spark编程教程

19-01-12 945 banq

Apache Spark是一个分布式计算平台,在当今非常流行,特别是因为与Hadoop mapreduce相比性能要好得多,Spark比基于磁盘的hadoop mapreduce 快了近100倍。让... 详细

Apache Hadoop管理的23个技巧

18-10-14 332 1 banq

本文由Renata Ghisloti Duarte Souza Gra撰写。 在这篇文章中,我将分享我在使用Apache Hadoop环境多年后学到的一些技巧。这里的经验主要考虑了Apache H... 详细

Trivagoj为何从Hive/SQL迁移到PySpark/Python?

18-12-17 257 banq

Trivago是一个以拍卖为基础的市场。广告商可以通过拍卖购买指定酒店的查询结果页面中的重要位置,trivago的拍卖机制将几个因素:价格、点击率和出价本身,以确定拍卖获胜者。当您访问trivago... 详细

共有 291 2 3 4 下一页