banq老师:您好!好久不见,最近过得还好吧!
我是在上海培训的那个cxykl,和你一起去安捷伦听课的,我现在就在那个楼上班,
我现在要做的手上的工作是做一个类似淘宝(http://www.taobao.com/, http://auction1.taobao.com/auction/ad_search.htm)的站内搜索,
我先请教一下流程:
读数据库->预处理->分词->建立索引, 包括定时全文索引和定时增量索引
和索引的优化(field的最大值、内存最大存document数,等),indexwrite.omptize
构建查询对象->对结果评分->排序、过滤和分页
建立索引和检索这两方面流程是否正确,有没有缺的和要注意的地方,
是建索引难还是检索难?
象taibao这样的网站中的搜索,三个人,要花多长的时间做出来 我们对搜索都不是太熟 , 我大致能能理解整个流程,如果可以的话,能大致帮我写个时间表,我知道我这个要求很过分,简单一点就行,不胜感激!
另象jive2.5中的检索是否和我们做的站内搜索一样,是否可以参考jive2.5
lucene2.0的中文分词用哪一个比较好,je、中科院的那个,还是 lucene-cn 或 stanrdAnylzer?
万分火急的cxykxl!
2007-06-12