Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
ElasticSearch全文搜索
位图索引的工作原理 - Richard
位图索引用于各种数据技术以实现高效的查询处理。在高层次上,位图索引可以被认为是一组谓词在数据集上的物理具体化,它自然是列式的,特别适合多维布尔查询处理。 当有多个属性受查询约束时(例如在复合 where 子句中),
zinc:替代elasticsearch的轻量级Go语言搜索引擎
Zinc 是一个进行全文索引的搜索引擎。它是弹性搜索的轻量级替代品,运行在不到 100 MB 的 RAM 中。它使用bluge作为底层索引库。与
Tantivy与Quickwit:类似Lucene的Rust全文搜索引擎库
Tantivy 是一个受 Apache Lucene 启发并用 Rust 编写的全文搜索引擎库。Tantivy是一个用 Rust 编写的全文搜索引擎库。它更接近
10个技巧优化Elasticsearch查询性能
关于如何减少 Elasticsearch 搜索延迟和优化搜索性能的 14 个技巧:size参数为 size 参数分配一个巨大的值会导致 Elasticsearch 计算大量的命中,从而导致严重的性能问题。您应该批量处理小尺寸的请求,而不是设置巨大的尺寸。分片
Apache Doris是Elasticsearch + Grafana Loki优点的综合
理想的日志处理系统应该支持: 高吞吐量实时数据摄取:它应该能够批量写入博客,并使它们立即可见。 低成本存储:它应该能够存储大量的日志而不需要花费太多的资源。 实时文本搜索:它应该能够快速搜索文本。 业界常
使用JSON输入/输出测试Logstash配置
Logstash是一个数据处理管道,允许您从各种来源收集数据,然后将其转换并发送到目的地。它最常用于将数据发送到Elasticsearch(一种分析和搜索引擎),然后可以使用Kibana进行查看。Elasticsearch、Logstash和Kibana一起构成了
Discord使用ElasticSearch建立数十亿条消息的索引 -Sukhad
Discord 有数百万用户每天发送数十亿条消息。现在,这些用户也想搜索这些消息。我们如何索引这些以使它们可以通过消息中的不同关键字进行搜索?让我们来了解一下: 1. 简单的答案是 Discrd 使用 ElasticSearch,Elast
使用 Postgres 的全文搜索构建可扩展的事件驱动搜索架构
需求:搜索由三个可搜索字段、标题和描述(使用全文搜索)和文档 ID 组成的文档,能够查找包含文档 ID 的字符串。搜索应该在不超过 200 毫秒的时间内运行超过 100 万个文档。 PostgreSQL 支持全文搜索。全文索引允许对
谷歌与OpenAI的争论 - swyx
2 个月前 OpenAI 推出 ChatGPT 后,多米诺骨牌继续倒下: “谷歌距离全面颠覆可能只有一两年的时间。” “微软计划使用ChatGPT 为 Bing 提供支持,并计划在几个月内推出。” “微软将以290 亿美元的估值完成对OpenAI 的 10
tinysearch/tinysearch: 使用Rus和Wasm构建的静态网站的微型全文搜索引擎
使用 Rust 和 Wasm 构建的静态网站的小型全文搜索引擎tinysearch ,tinysearch 是一个轻量级、快速、全文搜索引擎。它专为静态网站而设计。tinysearch 是用 Rust 编写的,然后编译成 WebAssembly 以在浏览器中运行。它可以与静态站点生成
一切都使用 Postgres
如何降低复杂性并加快行动速度? 使用 Postgres 作为消息队列跳过锁定
模因搜索引擎findthatmeme.com是如何构建的?
任何在互联网上花过任何时间的人都很清楚模因梗的使用在网上话语中已经变得多么普遍了。在最新发生的事件中寻找新的模因梗,并与不同的朋友群体分享它们的幽默,是我长期以来喜欢的一种消遣方式。 然而,大多数幽默模因有一个讽刺性的双重性:它们越是小众,就越是有
GitHub - a5huynh/spyglass: 个人搜索引擎
传统的网络搜索很糟糕,使用这个开源工具可建立个人搜索引擎,它可以使用一组简单的规则抓取和索引你想要的网站/文件. Spyglass 存在于您的设备上,通过一组基本规则对您想要的网站进行爬网和索引。压缩为文本的网页非常小。借助当今令人难以置信
使用Trigram优化Postgres文本搜索 - Alex Klibisz
在这篇文章中,我们将实现和优化一个基于Postgres Trigrams的文本搜索系统。我们将从一些基本概念开始,然后基
Netflix可扩展的数据注释服务
在Netflix,我们有数百个微型服务,每个都有自己的数据模型或实体。例如,我们有一个存储电影实体元数据的服务或一个存储图像元数据的服务。所有这些服务在以后都想对他们的对象或实体进行注释。我们的团队,资产管理平台,决定创建一个名为Marken的通用服务
是否有专门的欺诈分析工作? - Reddit
如何使用关系数据库和统计模型来检测金融欺诈并保护普通人的银行账户? 1、我的部分工作是使用规则和模型来检测潜在的交易欺诈和激励游戏,但也延伸到检测垃圾邮件、不当内容和虚假评论等方面。我的角色可能比你在大多数地方找到的要广泛一些。您会发现不同
spring-boot-logging:记录Spring Boot HTTP请求/响应并与Elastic栈集成
创建该库是为了记录传入的 HTTP 请求和传出的 HTTP 响应,并将这些日志自动发送到 Logstash。 spring-boot-logging是用于记录 Spring Boot 应用程序的 HTTP 请求/响应以及与 Elastic Stac
MarginaliaSearch:用Java编写的无需数据中心的互联网搜索引擎
Marginalia是一个独立的互联网开源搜索引擎,它是在线 Marginalia Search的源码。 该项目的目的
上页
下页
关闭