Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
ElasticSearch全文搜索
Liquid AI联手Shopify把推荐算法卷成20毫秒闪电,买家还没眨眼商品已跳脸!
Liquid AI与Shopify深度捆绑,推出20毫秒内完成推理的“史莱姆”大模型,搜索与推荐转化率暴涨,电商进入“眨眼经济”新纪元。 ——— 美国波士顿剑桥那帮卷王公司Liquid AI,刚刚官宣和Shopify签了一个多年、多千万美元的‘婚
将Postgres转变为快速OLAP数据库
pg_analytics 是一个扩展,可将任何 Postgres 数据库的本地分析性能提高 94 倍。安装 pg_analytics 后,Postgres 的速度比 Elasticsearch 快 8 倍,在分析基准测试中几乎与
JVector:一个纯Java嵌入式矢量搜索引擎
JVector 是一个纯 Java 嵌入式矢量搜索引擎,由DataStax Astra DB和(即将推出)Apache Ca
Apache Calcite 简介
在本教程中,我们将了解Apache Calcite。它是一个功能强大的数据管理框架,可用于与数据访问有关的各种用例。它专注于从任何来源检索数据,而不是存储数据。此外,
Postgres不适合用于全文搜索的几种场景
与以搜索为中心的数据库相比,Postgres 全文搜索存在不足的九个领域的概述。 什么是全文搜索?全文搜索是指将部分或全部文本查询与数据库中存储的文档进行匹配。与传统的数据库查询相比,全文搜索即使在部分匹配的情况下
Spring Boot 3.4 结构化日志记录
Spring Boot 3.4 中定义明确、通常机器可读的日志记录格式:支持常见的结构化格式,并且可自定义。 日志记录是应用程序故障排除中长期存在的一部分,也是可观察性的三大支柱之一,仅次于指标和跟踪。没有人喜欢在生产中盲目行事,当事件发生时,开发
七篇Meta等大科技公司工程博文
1.
OpenAI新AI搜索将颠覆谷歌等传统搜索引擎
OpenAI 似乎正准备通过其人工智能搜索竞争者直接挑战谷歌,尽管具体信息仍然有限。 人工智能 (AI) 公司 OpenAI 已准备好再次给科技行业带来惊喜。有报道称,他们正在私下开发一款网络搜索产品,以挑战谷歌在搜索领域的权威。如果成功,这一举措可能会重
Manticore Search:快速高效替代Elasticsearch
Manticore Search是一个易于使用,开源和快速的数据库,专为搜索而设计。它是Elasticsearch的一个很好的替代品。 它与其他解决方案的区别在于: 它的速度非常快,因此比替代品更具成本效益,例如Manticore:
ApeRAG:一个生产级RAG检索增强生成开源国产平台
ApeRAG 是一个生产级 RAG(检索增强生成)平台,结合了图 RAG、向量搜索、全文搜索和先进的 AI 智能体。构建具有混合检索、多模态文档处理、智能代理和企业级管理功能的复杂 AI 应用程序。 ApeRAG是构建您自己的知识图、上下文工程和部
将聚合添加到 Elasticsearch 查询
Elasticsearch是一个搜索和分析引擎,适合需要灵活过滤的场景。有时,我们需要检索所请求的数据及其聚合信息。 在本教程中,我们将探讨如何做到这一点。 Elasticsearch 聚合搜索让我们首先探索 El
为什么AI时代搜索引擎仍离不开30年前BM25算法
三十年前的BM25算法凭借其毫秒级响应、完美可解释性和稳定性能,在人工智能时代依然是搜索引擎的核心支柱,与神经网络形成优势互补。 先来认识下作者希瓦·贾斯瓦尔,他是一位专注于搜索技术和人工智能实践的技术专家,擅
PGroonga 4.0.4发布:PostgreSQL秒搜中文等全球语言
PGroonga 4.0.4正式上线,全面支持PostgreSQL 18,实现多语言毫秒级中文亚洲语言全文检索,无需ETL,开箱即用! 2025年10月9日,PGroonga项目组正式发布了PGroonga 4.0.4版本!这个版本可不是小打小闹的
Spring Boot中用Elasticsearch导入CSV
在本教程中,我们将学习如何使用 Spring Boot 将数据从 CSV 文件导入 Elasticsearch。当我们需要从旧系统或外部来源迁移数据,或者准备测试数据集时,从 CSV 文件导入数据是一种常见的用例。 在本文中,我们介绍了如何使用三种方法将
Elasticsearch从来就不是数据库! 别再当DB用了
Elasticsearch本为搜索而生,非事务型数据库,强行作为主数据源将导致一致性缺失、运维复杂、查询受限等问题,应回归其索引定位,选用合适系统保障数据正确性。 我知道“数据库”“Elasticsearch”听起来像是程序员才懂的黑话,但其实它跟
使用矢量引擎jVector构建索引和搜索向量教程
在本文中,我们简要介绍了jVector构建索引和搜索向量的核心功能。我们还研究了HNSW和HNANN结构如何在jVector中工作,以确保效率和正确性。在人工智能和信息检索领域,经常需要在数据集中搜索相似向量。许多系统,如推荐系统、文本情感分析或文本生成,都使用向量搜索。在本文中,我
BloomSearch:使用Bloom过滤器搜索关键字
面向海量数据集的分层布隆过滤器关键词搜索引擎,使用布隆过滤器替代B树实现数据索引! BloomSearch通过可插拔存储接口提供极低的内存使用率和低冷启动搜索。 内存效率:Bloom过滤器具有恒定的大小,无论数据量如何 可插
使用向量搜索实现产品匹配系统的案例分享
产品匹配系统1、客户端上传图片,填写问题,我们已经创建了一个配置文件;比方说人高,深色头发,对比皮肤,某某体重,体型,在银行工作,经常外出,所以我们以某种方式标记客户端以便将来匹配 2、在另一边有一个项目的集合(以结构化数据的形式),比如图
下页
关闭