• 这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页 icon
  • 谈一个我自己的经历,也就是上个星期的事。 上星期做的一个东东是基于 LDAP 的员工查询系统。几个月前我实现了这个模块,但是当时的实现是每次查询都要与 LDAP 做通讯,取出所有符合查询条件的记录,然后做分页计算,显示后就将记录集丢掉。一旦分页,又要做相同 icon
  • lucene给的demo是针对文件夹的。那么在jsp环境下,使用lucene检索整个网站的信息,请 问如何与数据库交互(就是怎样看待数据库里的数据),最好给一个实例或者过程。^-^ 下载了jive的源码,感觉好复杂。:) icon
  • 搜索引擎技术核心揭密   编者按:这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。 icon
  • package MyTest; import org.apache.lucene.index.*;import org.apache.lucene.store.Directory;import org.apache.lucene.store icon
  • 谁能推荐一个能够解析 html的解释器? 解析完html静态页面后,能够提供 getTitle,getSummary,等方法? htmlparser2.0 不行,提供的方法太少,lucene2.0的有 bug,部分html中的特殊字符无法处理。总是报错: icon
  • 第一本国人自己编写的Ajax图书,喜欢Ajax的可下载本书。 下载地址:http://supermail.263.net/cgi-bin/supermail.fcg?func=downfile&ip=MTQ5ODk3NA==&ipfrom=c3h5dWZl icon
  • 大家都谈论lucene的优点,但是对于一些关键性的问题,还是要提出来,如果解决不料,lucene就无法进入真正的企业级应用。lucene2。0的demo中有个建立 text文件索引和 html文件索引的测试文件,但是 html文件在建立索引的时候,对于中文的网页,有 javascript的网 icon
  • 1、对于一个百万级数据量的表建立全文索引,也能先把数据从表中全读出来,再写进document么?2、doc.add方法可以将数据库的信息添加到lucene检索文件中,那如果数据库记录更新了,lucene是如何更新的呢? icon
  • 最近在用lucene做站内搜索引擎,烦劳的是项目用二十个左右的表,根据各个不同表的字段来实现搜索,这样就需要二十几个类来实现索引,而其中只是字段不同,很多代码重复!!苦劳!!能否给我一些建议,谢谢!! icon
  • 请问全文检索的思路?我这里只是对所有表进行检索,不设计到文档检索!我想应该:根据关键字检索所有的表,最后形成一张表,然后显示出来吧?但如何检索所有的表呢?想不通!望帮忙! icon
  • 关于Lucene的资料,我目前看的是车东的那份"在应用中加入全文检索功能――基于Java的全文索引引擎Lucene简介",看完以后,也做过几个小测试。在测试过程中,有两个问题不知道该如何处理? 1、如何向jive一样,搜索结果分页?2、如何象jiv icon
  • 开始研究lucene,但连它的demo都运行不了错误是说我的路径找不到我的路径(放查询对象)设置是String indexLocation = "/luceneDoc/index"; 我确实在c盘上建立了luceneDoc以及里面包 icon