Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
lucene全文搜索
开源纯JAVA全文搜索引擎,希望大家给点意见。
天刚完成的,做了好久了。一个纯java的全文搜索引擎框架。 做这个的目标是,更简单,更容易,以至任何一个懂java的人都可以很容易地搭建一个个人用的搜索引擎,例如个人站点的站内搜索。 主页:http://j-bo
ORM框架和数据库对系统性能影响的比较
面向对象分析问题,开发系统是程序员的福音,这点我很有同感,但是一直没有对ORM框架进行深入的研究。最近公司开发一个项目,由于技术总监是搞数据库的,所以一直在以数据库建表方式构架系统,大家知道,搞数据库表不可避免的要设计很多细节,功能细节,实现细节。目前项目进展非常缓慢。我在项目组一直倡导首先业务建模
lucene和NoSQL的结合
Solandra早期产品是
分享IKAnalyzer 3.0 中文分词器
关键字: ik analyzer 3.0 中文分词 lucene java1.IKAnalyzer3.0介绍 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer
分词算法
大哥们,我是学java的,以后可能从事WEB方面编程,现在我们要选毕业设计了, 而我不想老是只做和数据库方面的WEB项目打交道,想学下 分词算法方面的知识, 现在好矛盾啊, 不知道要不要选 分词算法应用这方面的知识....你们给点建议好吗? 这可关系
Solr与Spring Boot集成 - Viithiisys
在本教程中,我将向您展示如何通过将Solr与Spring Boot集成来改进搜索。Spring-data-solr是S
lucene中ParallelReader.java使用中的难点
需求:表a 一对一 表b表a 做到索引中后不需要频繁的修改表b 做到索引中后会频繁的修改索引查询时需要结合表a和表b中的字段进行连接查询 org.apache.lucene.index.ParallelReader的作
介绍一个自己写的基于字典的中文分词器
ShuzhenAnalyzer是一款用java写的基于字典的中文分词器,可与Lucene一起使用构建搜索引擎系统 其特性如下: 1、分词时完全按照标准分词来进行,这样保证了在和一些高亮显示组件如highlight
对全站信息检索的一些思路
最近突然想到全站信息检索查询譬如一个卖东西的交易平台,现在想做一个对在线商品的模糊搜索,不知各位是如何处理此类情况的,如果单纯的使用like 语句进行查询,这个简单,可效率不用说就是一个很大的瓶颈,如果我不想牺牲这么大的开销,所以想使用 lucence ,首先对数据库进行检索,在磁盘中存储对
在JAVA中将Elasticsearch索引加载到Lucene API
每隔一段时间,Elasticsearch中就会出现意外(或无意)崩溃。对于我的情况,在Elasticsearch的大量IO操作期间是硬件故障(让我们假设我没有任何副本或者我设法使所有集群崩溃)。经过一些研究,我发现它搞砸了许多索引的状态文件(已损坏!)。我想,如果Elasticsearch使
请教luncene的性能
本人现在打算用luncene做搜索系统,用户量假设4000万,并发可能会很大。有几个问题没搞清楚:1:luncene最大能够支持多大的索引文件(在性能没有太大影响的情况下)2:luncene执行检索的时候是将索引文件完全加载到内存中,然后再查询吗?3:当业务继续上升时,单台机
对 ForumThread 建模的一点疑问
JiveJdon 对 ForumThread 的设计从理论上分析似乎很合理,但是从实际应用来看,好像会有很大问题。 比如搜索,通常我们只针对主题搜索,jive 必须在上百万的 message 表里搜索,而如果是放在 thread 表,只需要在几万表里搜,搜
请教板桥大哥jdon中关键字检索用的是 lucene吗?
请教板桥大哥jdon中关键字检索用的是 lucene吗?如果是的话,板桥大哥的这个的翻页是如何实现的。谢谢。
急急请教banq老师,关于lucene的问题
banq老师:您好!好久不见,最近过得还好吧! 我是在上海培训的那个cxykl,和你一起去安捷伦听课的,我现在就在那个楼上班, 我现在要做的手上的工作是做一个类似淘宝(http://ww
请教搜索引擎lucene怪事件
我在程序应用中需要个站内搜索,于是我采用了lucene开源框架,我应用成功后我发现个怪事情,那就是只要我搜索"IT"或者是"it",无论你索引中又没又it这个词存在,都查询不到,我不明白,其他的关键字都可以,难道这个是什么bug,应该不会啊,我搜索了下网络上面,都没发现这类信息,有谁知道,吗??高手
Jdon有没有操作大内存的实践和建议?
请教banq, 最近在做搜索引擎,基于lucene,索引超过10G,而且还在不断增长。 为了提高查询速度,想把索引加载到堆外内存中。找了很多论坛和资料,都没有找到较好的实践数据来支撑这种做法。这样做是否合理,Jdon有没有类似的实践或应用场景?
Yokozuna - 使用Solr搜索Riak
Video: Introducing Yokozuna - Searching Riak With Solr
请教关于lucene2.0检索的问题
小弟新手,目前在lucene中遇到的问题如下(lucene版本为2.0): 建立了2个字段的索引:doc.add(new Field("maincontent",text, Field.Store.YES, Field.Index.TOKENIZE
上页
下页