• 作为一名开源爱好者,我相信协作的力量可以使开源项目更快、更高效。在这篇博文中,我将分享我的Linagora团队如何与 OpenSearch 社区合作,使用基准测试工具和火焰图识别并解决 OpenSearch Java 客户端中的性能问题,为 Apache James项目做出贡献。 <
  • pg_analytics 是一个扩展,可将任何 Postgres 数据库的本地分析性能提高 94 倍。安装 pg_analytics 后,Postgres 的速度比 Elasticsearch 快 8 倍,在分析基准测试中几乎与 icon
  • 搜索引擎是一种可以搜索已被全文索引的数据中的任何文本的软件。虽然有 Google 和 Bing 等公共搜索引擎,但我们在本博客中讨论的不是它们,而是允许您在自己的数据中搜索文本的软件。将此类搜索引擎软件想象为 google 或 bing,但仅用于您自己的数据。 icon
  • JVector 1.0正式发布。 向量搜索的并发、增量、纯Java实现,在大型数据集上比Lucene快10倍。 JVector 是一个纯 Java 嵌入式矢量搜索引擎,为 icon
  • JVector 是一个纯 Java 嵌入式矢量搜索引擎,由DataStax Astra DB和(即将推出)Apache Ca icon
  • 在本教程中,我们将了解Apache Calcite。它是一个功能强大的数据管理框架,可用于与数据访问有关的各种用例。它专注于从任何来源检索数据,而不是存储数据。此外, icon
  • 与以搜索为中心的数据库相比,Postgres 全文搜索存在不足的九个领域的概述。 什么是全文搜索?全文搜索是指将部分或全部文本查询与数据库中存储的文档进行匹配。与传统的数据库查询相比,全文搜索即使在部分匹配的情况下 icon
  • 基于AI的搜索/文档查找中发生了如此多的创新,大模型RAG领域在过去的2周发生4件大事: 1、更好的检索ColBERT检索模型现在很容易使用! 它比其他人工智能方法更快地返回更好的结果。现在,它很容易用于检索。 icon
  • Elasticsearch 是(且不仅仅是)企业搜索的领先解决方案之一。因此,有必要了解它的内部运作方式,以便更好地利用其功能。让我们通过一个简短的旅程来了解 Elasticsearch 的内部工作原理。 Lucene icon
  • Spring Boot 3.4 中定义明确、通常机器可读的日志记录格式:支持常见的结构化格式,并且可自定义。 日志记录是应用程序故障排除中长期存在的一部分,也是可观察性的三大支柱之一,仅次于指标和跟踪。没有人喜欢在生产中盲目行事,当事件发生时,开发 icon
  • 1.  icon
  • Qdrant是一个矢量相似性搜索引擎和矢量数据库。它提供了一个生产就绪的服务,带有一个方便的 API 来存储、搜索和管理带有额外负载的点向量 Qdrant 是为扩展过滤支持而定制的。它对于各种神经网络或基于语义的匹配、分面搜索和其他应用都很有用。 < icon
  • OpenAI 似乎正准备通过其人工智能搜索竞争者直接挑战谷歌,尽管具体信息仍然有限。 人工智能 (AI) 公司 OpenAI 已准备好再次给科技行业带来惊喜。有报道称,他们正在私下开发一款网络搜索产品,以挑战谷歌在搜索领域的权威。如果成功,这一举措可能会重 icon
  • Elasticsearch是一个搜索和分析引擎,适合需要灵活过滤的场景。有时,我们需要检索所请求的数据及其聚合信息。 在本教程中,我们将探讨如何做到这一点。 Elasticsearch 聚合搜索让我们首先探索 El icon
  • 在本教程中,我们将学习如何使用 Spring Boot 将数据从 CSV 文件导入 Elasticsearch。当我们需要从旧系统或外部来源迁移数据,或者准备测试数据集时,从 CSV 文件导入数据是一种常见的用例。 在本文中,我们介绍了如何使用三种方法将 icon
  • 产品匹配系统1、客户端上传图片,填写问题,我们已经创建了一个配置文件;比方说人高,深色头发,对比皮肤,某某体重,体型,在银行工作,经常外出,所以我们以某种方式标记客户端以便将来匹配 2、在另一边有一个项目的集合(以结构化数据的形式),比如图 icon
  • 面向海量数据集的分层布隆过滤器关键词搜索引擎,使用布隆过滤器替代B树实现数据索引! BloomSearch通过可插拔存储接口提供极低的内存使用率和低冷启动搜索。 内存效率:Bloom过滤器具有恒定的大小,无论数据量如何 可插 icon