Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
lucene全文搜索
Lucene可以对MYSQL进行全文检索吗?
可以吗? 能否告诉我方法 ? 我在网上找到的都是对文本进行检索的
lucene中文分词组件(词典全切分算法)下载
下载地址: http://groups-beta.google.com/group/SegWord/web/IKAnalyzer.jar IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法,是Luc
转贴:google搜索原理论文1
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页
分享一个经历
谈一个我自己的经历,也就是上个星期的事。 上星期做的一个东东是基于 LDAP 的员工查询系统。几个月前我实现了这个模块,但是当时的实现是每次查询都要与 LDAP 做通讯,取出所有符合查询条件的记录,然后做分页计算,显示后就将记录集丢掉。一旦分页,又要做相同
请教一个使用lucene做全文检索与数据库连接时的问题
lucene给的demo是针对文件夹的。那么在jsp环境下,使用lucene检索整个网站的信息,请 问如何与数据库交互(就是怎样看待数据库里的数据),最好给一个实例或者过程。^-^ 下载了jive的源码,感觉好复杂。:)
转贴一篇构建高效internet搜索引擎的文章,算是对贡献吧。
搜索引擎技术核心揭密 编者按:这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。
lucene里删除不了索引请帮忙看看
package MyTest; import org.apache.lucene.index.*;import org.apache.lucene.store.Directory;import org.apache.lucene.store
谁能推荐一个好的html parser,除了lucene自带那个!
谁能推荐一个能够解析 html的解释器? 解析完html静态页面后,能够提供 getTitle,getSummary,等方法? htmlparser2.0 不行,提供的方法太少,lucene2.0的有 bug,部分html中的特殊字符无法处理。总是报错:
【新书下载】征服Ajax+Lucene――构建搜索引擎
第一本国人自己编写的Ajax图书,喜欢Ajax的可下载本书。 下载地址:http://supermail.263.net/cgi-bin/supermail.fcg?func=downfile&ip=MTQ5ODk3NA==&ipfrom=c3h5dWZl
Lucene 2.0 对 html文件建立索引的bug
大家都谈论lucene的优点,但是对于一些关键性的问题,还是要提出来,如果解决不料,lucene就无法进入真正的企业级应用。lucene2。0的demo中有个建立 text文件索引和 html文件索引的测试文件,但是 html文件在建立索引的时候,对于中文的网页,有 javascript的网
lucene入门问题
1、对于一个百万级数据量的表建立全文索引,也能先把数据从表中全读出来,再写进document么?2、doc.add方法可以将数据库的信息添加到lucene检索文件中,那如果数据库记录更新了,lucene是如何更新的呢?
有关搜索引擎的设计问题
最近在用lucene做站内搜索引擎,烦劳的是项目用二十个左右的表,根据各个不同表的字段来实现搜索,这样就需要二十几个类来实现索引,而其中只是字段不同,很多代码重复!!苦劳!!能否给我一些建议,谢谢!!
请问全文检索的思路?
请问全文检索的思路?我这里只是对所有表进行检索,不设计到文档检索!我想应该:根据关键字检索所有的表,最后形成一张表,然后显示出来吧?但如何检索所有的表呢?想不通!望帮忙!
关于lucene的菜鸟问题。
关于Lucene的资料,我目前看的是车东的那份"在应用中加入全文检索功能――基于Java的全文索引引擎Lucene简介",看完以后,也做过几个小测试。在测试过程中,有两个问题不知道该如何处理? 1、如何向jive一样,搜索结果分页?2、如何象jiv
使用lucene时出现路径错误
开始研究lucene,但连它的demo都运行不了错误是说我的路径找不到我的路径(放查询对象)设置是String indexLocation = "/luceneDoc/index"; 我确实在c盘上建立了luceneDoc以及里面包
上页