一个组集群服务器(server1 ,server2 ,server3 ,server3),每天产生很产生很多日志(记录了IP,时间。。。),4台服务器会生成一个500G的大日志。现在需要对这500G的日志继续分析,找到出现IP最多的日志记录。
要怎么分析了,有条件的,给一台机器给你 8G内存 双核CPU ,问你怎么利用这台服务器来分析上面所说的情况??、有什么好的解决方案,我听了后,觉得就是分批处理,使用消息通信机制,我很喜欢研究这个问题,希望给大家讨论下????
至于需要多少机器,取决于你每天日志数据量。
最原始的是,将日志文件合并后,用LINUX SH或python脚本完成统计。
找到哪一个IP的记录最多?
如果没理解错的话,500G的日志并不算大啊,最传统的处理就行了。
[该贴被alexwoo于2012-10-11 20:20修改过]
猜你喜欢
本站原创《复杂软件设计之道:领域驱动设计全面解析与实战》