#lucene全文搜索
lucene中文分词组件(词典全切分算法)下载

下载地址: http://groups-beta.google.com/group/SegWord/web/IKAnalyzer.jar IKAnalyzer基于lucene2.0版本API开发... 详细
谁能推荐一个好的html parser,除了lucene自带那个!

谁能推荐一个能够解析 html的解释器? 解析完html静态页面后,能够提供 getTitle,getSummary,等方法? htmlparser2.0 不行,提供的方法太少,lucene2.0... 详细
对 ForumThread 建模的一点疑问

JiveJdon 对 ForumThread 的设计从理论上分析似乎很合理,但是从实际应用来看,好像会有很大问题。 比如搜索,通常我们只针对主题搜索,jive 必须在上百万的 message 表里搜... 详细
对全站信息检索的一些思路

最近突然想到全站信息检索查询 譬如一个卖东西的交易平台,现在想做一个对在线商品的模糊搜索,不知各位是如何处理此类情况的,如果单纯的使用like 语句进行查询,这个简单,可效率不用说就是一个很大的瓶颈,... 详细
急急请教banq老师,关于lucene的问题

banq老师:您好!好久不见,最近过得还好吧! 我是在上海培训的那个cxykl,和你一起去安捷伦听课的,我现在就在那个楼上班, 我现在要做的手上的工作是做一个类似淘宝(h... 详细
Lucene 2.0 对 html文件建立索引的bug

大家都谈论lucene的优点,但是对于一些关键性的问题,还是要提出来,如果解决不料,lucene就无法进入真正的企业级应用。 lucene2。0的demo中有个建立 text文件索引和 html文件索... 详细
请教关于lucene2.0检索的问题

小弟新手,目前在lucene中遇到的问题如下(lucene版本为2.0): 建立了2个字段的索引: doc.add(new Field("maincontent",text, Field.Store... 详细
分享一个免费的 Lucene中文分词组件V1.2.2

1.2.2 完善了中英文噪声词典 1.2.1 修正中文数字成语无法识别的问题 1.2 增加中文数字的匹配(如:二零零六) 数量词采用“n”作为数字通配符 优化词典结构以便修改调整 ... 详细