设计一个门户网站

如果我要设计开发这样一个网站(http://www.pcauto.com.cn/

前提:网站开发语言是java

提问1:部分内容,最新业界消息需要抓取,并结合人工编辑,这类似一个cms系统,抓取其他网站网页并加以处理合适自己的格式,这部分大家推荐用什么框架呢?需要注意哪些点呢?

提问2:网站涉及到很多图片,在服务器性能有限时,希望能借鉴外部一些存储技术,包括试下流行的云存储(阿里云)和CDN,但考虑到初期网站规模负担不起高昂的费用,大家能推荐一些业界开源或者免费的存储方案吗?

提问3:服务本身(包括数据库服务器)配置不是太好,需要考虑到大量用户涌入高并发访问,服务器的压力等,希望能够引入缓存框架,考虑到运维等问题,不可能引入类如淘宝tair这样重量级缓存框架,大家能推荐一款轻量级且适合这种网站架构的缓存框架吗?

提问4:面对这种网站结构,前端页面渲染框架,个人感觉struts等mvc框架不是很合适,个人认为velocity比较好,大家认为呢?

上面仅仅是个人的观点,可能还有一些需要在网站设计架构就需要考虑的点,如选用如何建模?如何设计便于扩展数据库的模型?很希望大家能够给予一些意见 @banq

[该贴被runc于2013-05-08 21:23修改过]
[该贴被runc于2013-05-08 21:26修改过]
[该贴被runc于2013-05-08 21:30修改过]
[该贴被runc于2013-05-08 21:31修改过]

免费CDN可以用加速乐 chinacache等,缓存用Guava Cache。

爬虫和前端渲染无法给你建议。

自己写个windows服务,开多线程抓就是了,建议用dom解析抓取到的内容,不要用开始/结束标记或者正则匹配。
不需要渲染,都整站静态化了,还渲染什么?模板引擎和推荐区域的相关知识可以参考一下zcms