对全站信息检索的一些思路

07-08-15 Ericx
    

最近突然想到全站信息检索查询
譬如一个卖东西的交易平台,现在想做一个对在线商品的模糊搜索,不知各位是如何处理此类情况的,如果单纯的使用like 语句进行查询,这个简单,可效率不用说就是一个很大的瓶颈,如果我不想牺牲这么大的开销,所以想使用 lucence ,首先对数据库进行检索,在磁盘中存储对应索引,然后查询时在构造lucence 的查询语句,从lucence中查询出符合条件的结果和Id,然后如果用户请求就可以直接构造数据库查询语句,这样效率就有很大的提升,具体思路如下:
其实主要问题就是数据库的数据和lucence索引的数据同步问题,我的简单思路是这样,
每次对数据库进行更新时,使用Observer模式或AOP interceptor进行拦截,分模块使用lucence更新索引,不知大家有什么意见

    

Ericx
2007-08-15 14:34

毕竟对信息检索方面,lucence的可操作性是like query 远不能及的

Ericx
2007-08-15 14:36

哦对了,我有一个偷懒的解决方法,就是在 google query 中加 site 语句,依靠强大的google ,呵呵,懒人的方法,结果回来了再改页面技术难度为 0