ElasticSearch全文搜索
Apache Doris是Elasticsearch + Grafana Loki优点的综合

理想的日志处理系统应该支持: 高吞吐量实时数据摄取:它应该能够批量写入博客,并使它们立即可见。 低成本存储:它应该能够存储大量的日志而不需要花费太多的资源。 实时文本搜索:它应该能够快速搜... 详细
MarginaliaSearch:用Java编写的无需数据中心的互联网搜索引擎

Marginalia是一个独立的互联网开源搜索引擎,它是在线 Marginalia Search 的源码。 该项目的目的是为 Internet 开发新的替代发现方法。它既是一项公共服务,又是一个... 详细
GitHub - a5huynh/spyglass: 个人搜索引擎

传统的网络搜索很糟糕,使用这个开源工具可建立个人搜索引擎,它可以使用一组简单的规则抓取和索引你想要的网站/文件. Spyglass 存在于您的设备上,通过一组基本规则对您想要的网站进行爬网和索引。... 详细
Netflix可扩展的数据注释服务

在Netflix,我们有数百个微型服务,每个都有自己的数据模型或实体。例如,我们有一个存储电影实体元数据的服务或一个存储图像元数据的服务。 所有这些服务在以后都想对他们的对象或实体进行注释。 我们的... 详细
是否有专门的欺诈分析工作? - Reddit

如何使用关系数据库和统计模型来检测金融欺诈并保护普通人的银行账户? 1、我的部分工作是使用规则和模型来检测潜在的交易欺诈和激励游戏,但也延伸到检测垃圾邮件、不当内容和虚假评论等方面。我的角色可能比... 详细
谷歌与OpenAI的争论 - swyx

2 个月前 OpenAI 推出 ChatGPT 后,多米诺骨牌继续倒下: “谷歌距离全面颠覆可能只有一两年的时间。” “微软计划使用ChatGPT 为 Bing 提供支持,并计划在几个月内... 详细
模因搜索引擎findthatmeme.com是如何构建的?

任何在互联网上花过任何时间的人都很清楚 模因 梗的使用在网上话语中已经变得多么普遍了。在最新发生的事件中寻找新的模因梗,并与不同的朋友群体分享它们的幽默,是我长期以来喜欢的一种消遣方式。 然而... 详细
一切都使用 Postgres

如何降低复杂性并加快行动速度? 使用 Postgres 作为 消息队列 跳过锁定 而不是 Kafka(如果你只需要一个消息队列)。 使用 Postgres . 详细
10个技巧优化Elasticsearch查询性能

关于如何减少 Elasticsearch 搜索延迟和优化搜索性能的 14 个技巧: size参数为 size 参数分配一个巨大的值会导致 Elasticsearch 计算大量的命中,从而导致严重... 详细
使用 Postgres 的全文搜索构建可扩展的事件驱动搜索架构

需求: 搜索由三个可搜索字段、标题和描述(使用全文搜索)和文档 ID 组成的文档,能够查找包含文档 ID 的字符串。 搜索应该在不超过 200 毫秒的时间内运行超过 100 万个文档。 Postg... 详细
Discord使用ElasticSearch建立数十亿条消息的索引 -Sukhad

Discord 有数百万用户每天发送数十亿条消息。现在,这些用户也想搜索这些消息。我们如何索引这些以使它们可以通过消息中的不同关键字进行搜索? 让我们来了解一下: 1. 简单的答案是 Discrd... 详细
使用JSON输入/输出测试Logstash配置

Logstash是一个数据处理管道,允许您从各种来源收集数据,然后将其转换并发送到目的地。它最常用于将数据发送到Elasticsearch(一种分析和搜索引擎),然后可以使用Kibana进行查看。E... 详细
使用Trigram优化Postgres文本搜索 - Alex Klibisz

在这篇文章中,我们将实现和优化一个基于 Postgres Trigrams 的文本搜索系统。 我们将从一些基本概念开始,然后基于 890 万条亚马逊评论的数据集定义一个测试环境,然后涵盖三种可能的优... 详细
Tantivy与Quickwit:类似Lucene的Rust全文搜索引擎库

Tantivy 是一个受 Apache Lucene 启发并用 Rust 编写的全文搜索引擎库。 Tantivy是一个用 Rust 编写的全文搜索引擎库。 它更接近 Apache Lucene ,而... 详细
tinysearch/tinysearch: 使用Rus和Wasm构建的静态网站的微型全文搜索引擎

使用 Rust 和 Wasm 构建的静态网站的小型全文搜索引擎tinysearch ,tinysearch 是一个轻量级、快速、全文搜索引擎。它专为静态网站而设计。 tinysearch 是用 Ru... 详细