Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大数据架构指南
Lambda架构
sentric » Lambda Architecture, Part 1 H
In-Stream大数据处理模式
来自In-Stream Big Data Processing一文总结了当
我心中的云技术的发展问题?
我最近在关注云技术,我很迷茫,我觉得就是比服务器多,网上很多论坛也是这样认为的。云技术的演变 网格技术计算—>集群技术计算—>分布式技术计算—>云技术计算。 第一个问题:是这样一个慢慢的过程。其实我看了很多资料也没有怎么很明白这些技术的区分和层次感?
使用Hadoop和 Mahout实现推荐引擎
通过大数据分析,可以实现推荐机制,比如对电视观众浏览视频的大数据跟踪分析,可以得出点播排行榜 分析出用户的观看喜好习惯,并投其所好推荐一些影片等等。在电子商务网站,推荐功能就变成了导购功能。文章:
开源真正分布式实时大数据分析仓库Druid
Druid是数据分析公司Metamarket自己使用的大数据分析工具,现在被分享到开源社区,他们相信它的潜力远远超过他们自己公司,也就是如同自己孩子长大后需
Apache Gora™ 服务于大数据的内存模型框架
服务于大数据的内存模型 Apache Gora - In-Memory Model for Big Data Apache Gora提供
Big Data 辩论: HBase会统治NoSQL世界吗?
Big
使用Windows Azure HDInsight, Hadoop和Mahout机器学习建立一个推荐引擎
Stack Exchange/Stack Overflow能够基于用户回答问题的历史提示他能够回答的问题,亚马逊能够基于你之前购买历史推荐产品给你。那么这后面的推荐机制是如何实现的?
使用Hadoop+Hbase+Hive+SpringBatch实现数据仓库
使用Hadoop+Hbase
使用Mahout实现自然语言处理
cestella/NLPWithMahout · GitHub是一个使用Mahout实现自然语言处理(NLP:Natural Language P
大数据分析的具体处理??
大家好:有这样一个问题怎么处理分析了,大致情况如下: 一个组集群服务器(server1 ,server2 ,server3 ,server3),每天产生很产生很多日志(记录了IP,时间。。。),4台服务器会生成一个500G的大日志。现在需要对这500G的日志继续分析,找到出现IP最
五个有关推荐系统的资料
Recommended: 5 Great Talks on Recommender Sy
有关Shark的一份研究报告
Shark: SQL and Rich Analytics at Scale
JethroData:又一个新的数据库分析技术
大数据领域创新层出不穷,关键是Hadoop虽然奠定了基础,但是Hadoop的易用性面临很大改进余地,个人认为Hadoop类似大数据的操作系统,通过命令和Linux交互不是每个用户都能胜任的,而大数据偏偏是面向不太懂计算机的业务专家。 JethroData公
cassandra LMAX Disruptor
cassandra 2.0 也使集成 LMAX Disruptor 消息处理器,很强大啊。 LMAX Disruptor 是个神器,但如何把业务数据转为 LMAX Disruptor 喜欢的 “胃口”的数据,更神奇
使用set cover算法优化大型分布式系统的查询延迟
来自LinkedIn的一篇文章
Scoozie:创建大数据工作流
Scoozie: Creating Big Data Workflows
大数据的未来
如果说2012年是大数据概念为人所知、引人瞩目、小试牛刀的一年,那么2013年大数据将会实现产品部署,早期投资获得回报,一小部分的产业被颠覆。到了2014年,各种大数据项目和系统很可能成为标准配置,到处可见。 原文:
上页
下页
关闭