大数据架构指南 - 第14页

sentric » Lambda Architecture, Part 1 H

来自In-Stream Big Data Processing一文总结了当

通过大数据分析，可以实现推荐机制，比如对电视观众浏览视频的大数据跟踪分析，可以得出点播排行榜分析出用户的观看喜好习惯，并投其所好推荐一些影片等等。在电子商务网站，推荐功能就变成了导购功能。文章：

Big

Recommended: 5 Great Talks on Recommender Sy

cassandra 2.0 也使集成 LMAX Disruptor 消息处理器，很强大啊。 LMAX Disruptor 是个神器，但如何把业务数据转为 LMAX Disruptor 喜欢的 “胃口”的数据，更神奇

来自LinkedIn的一篇文章

大数据领域创新层出不穷，关键是Hadoop虽然奠定了基础，但是Hadoop的易用性面临很大改进余地，个人认为Hadoop类似大数据的操作系统，通过命令和Linux交互不是每个用户都能胜任的，而大数据偏偏是面向不太懂计算机的业务专家。 JethroData公

Scoozie: Creating Big Data Workflows

Stack Exchange/Stack Overflow能够基于用户回答问题的历史提示他能够回答的问题，亚马逊能够基于你之前购买历史推荐产品给你。那么这后面的推荐机制是如何实现的？

cestella/NLPWithMahout · GitHub是一个使用Mahout实现自然语言处理(NLP:Natural Language P

服务于大数据的内存模型 Apache Gora - In-Memory Model for Big Data Apache Gora提供

如果说2012年是大数据概念为人所知、引人瞩目、小试牛刀的一年，那么2013年大数据将会实现产品部署，早期投资获得回报，一小部分的产业被颠覆。到了2014年，各种大数据项目和系统很可能成为标准配置，到处可见。原文：

Shark: SQL and Rich Analytics at Scale

使用Hadoop+Hbase

Druid是数据分析公司Metamarket自己使用的大数据分析工具，现在被分享到开源社区，他们相信它的潜力远远超过他们自己公司，也就是如同自己孩子长大后需

大家好：有这样一个问题怎么处理分析了，大致情况如下：一个组集群服务器（server1 ，server2 ，server3 ，server3），每天产生很产生很多日志（记录了IP，时间。。。），4台服务器会生成一个500G的大日志。现在需要对这500G的日志继续分析，找到出现IP最

我最近在关注云技术，我很迷茫，我觉得就是比服务器多，网上很多论坛也是这样认为的。云技术的演变网格技术计算—>集群技术计算—>分布式技术计算—>云技术计算。第一个问题：是这样一个慢慢的过程。其实我看了很多资料也没有怎么很明白这些技术的区分和层次感？