#hadoop

质疑Lambda架构

14-07-04 7900 8 banq

Google和Twitter刚发布它们综合实时流处理和批处理的Lambda架构,LinkedIn的Jay Kreps则对这种架构提出了质疑,指出实时处理和批处理其实是两种范式,将它们硬生生捆绑在一起会... 详细

Spark只比Hadoop快19% ?

15-03-20 1 3855 5 banq

Spark比Hadoop并没有想象得那么快,以前号称快100倍,实际只快19%,这是 Making Sense of Performance in Data Analytics Frameworks.... 详细

纽约证券交易所的实时Map/Reduce大数据分析

13-11-25 3 3718 3 banq

Streaming Map/Reduce on Wall Street | Concurrent M 我们在纽约证券交易所NYSE建立的事件处理系统到现在已经超过20年了。 在过去的十年中,我们... 详细

Google使用Pipeline统一了大数据批处理和流处理

14-06-26 2 5133 1 banq

Google I/O大会上,Google宣布使用其google Cloud Dataflow替代原来的MapReduce,很多人误解为MR没有用了,以为MR被新的技术替代,其实并不是这回事。 目前大... 详细

H2O是开源基于大数据的机器学习库包

14-11-23 2659 1 banq

H2O 能够让Hadoop做数学,H2O是基于大数据的统计分析 机器学习和数学库包,让用户基于核心的数学积木搭建应用块代码,采取类似R语言 Excel或JSON等熟悉接口,使的BigData爱好者和... 详细

分解和组合的机器学习

14-11-04 829 banq

转发自 分解和组件的抽象方法 人的这种分解和组合思维能力也可通过机器学习算法进行模拟,再配合大数据进行训练,人工智能也就应运而生。 其实Hadoop的Map/reduce算法本身就是一个分解和组... 详细

针对Hadoop的分析工具:statsd-jvm-profiler

15-01-15 603 banq

statsd-jvm-profiler是一个JVM代理分析器,它用来专门分析Hadoop的job任务,但是也可以用于任何JVM进程。 etsy/statsd-jvm-profiler · Git... 详细

hadoop的Linux下简单安装步骤

13-08-26 430 banq

首先安装Hadoop cluster版本: $ curl -O http://archive.cloudera.com/cdh/3/hadoop-0.20.2-cdh3u6.tar.gz $ cd /... 详细

共有 29 上一页 1 2 3 4 下一页