• Deepseek引入的深度搜索成为2025年新标准。各大公司纷纷推出深度研究产品,AI工程师通过整合长期思考与推理,显著提升了搜索系统的性能与深度。 要点: 深度搜索DeepSearch经过搜索、阅
  • 如何在AI大模型秒变一篇文章的今天,划清人类与机器的界限,人类如何保持创见,而不是被机器喂养的奴隶? Nathan Savage 于 2025 年 1 月 2 日发表的文章《超越 RAG:构建增强而非取代思维的知识管理系统》讨论了在检索增强生成 (
  • 在本教程中,我们将使用Spring AI 框架和RAG(检索增强生成)技术构建一个 ChatBot。借助 Spring AI,我们将与Redis Vector 数据库集成以存储和检索数据,以增强LLM(大型语言模型)的提示。一旦 LLM 收到包含相关数据的提示,它就会有效地生成包含最新数据的自然语言 icon
  • 本周7篇架构文摘: 1、使用 icon
  • Llama 4 Scout模型发布了,它能一口气读1000万个字(相当于1万3千页书[1]),网上又有人喊"RAG技术没用了"……每次有新的大容量AI模型出来,这种争论就会冒头。今天我就来说说为啥我觉得RAG不会消失,就算AI能读更多文字了,RAG照样有用。 icon
  • 这事儿得从我五个月前杀回Redis公司说起!当时我屁股还没坐热呢,就跟同事唠嗑说咱要不要换个AGPL许可证啊?结果你猜怎么着?(突然压低声音)原来公司茶水间早就为这事儿吵翻天了!就像你们班选班长似的,AGPL和SSPL两派天天battle,虽然最后公司选了SSPL,但AGPL派还在暗搓搓搞事 icon
  • 最近那些超级AI(比如DeepSeek之类推理模型)变得特别会做题,秘诀就是让它们像人类一样"把思考过程写出来"。但这篇论文发现了个反常识的现象——有时候不思考反而更厉害! 神奇发现:用最新AI"深度求索- icon
  • 安迪·帕夫洛和迈克尔·斯通布雷克关于矢量数据库的严厉言辞:向量数据库(Vector Databases)无存在必要。 向量数据库是一种专门设计的数据库管理系统(DBMS),它们使用索引来加速最近邻搜索(nearest-neighbor search icon
  • 此存储库演示了一个基于 OpenAI Swarm 的简单系统,用于使用检索增强生成 (RAG) 进行多代理编排。它使用 FAISS 和 OpenAI 模型处理摘要、情绪分析、关键字提取和文档搜索等任务,展示了协作代理的强大功能。 特征 icon
  • 这是一个可以让大家一起写笔记、做 wiki 和整理文档的平台,而且还能随时扩展功能。它是用 Django 和 React 这两个技术做的。 笔记可以大家一起实时编辑,最后变成有用的知识! 它是 icon
  • 在本文中,我们探讨了如何使用 Spring AI、PGVector 和 Ollama 实现语义搜索。我们比较了两个端点;一个端点对我们的图书目录执行语义搜索,另一个端点使用 Ollama LLM 提供并增强该搜索结果。 搜索是软件中的一个基本概念,旨在从大 icon
  • 这张图片展示了三种不同的工作流程:自动化工作流程、AI工作流程(非代理型)和代理型工作流程。每种流程都以用户查询开始,并以响应结束。以下是每种流程的详细解释: 1. 自动化工作流程(基于规则,非AI):   - 用户查询输入后,进入一系列预定义的步 icon
  • 这篇文章通过一个程序员在80年代初发现新编程语言的比喻,来讨论LLM框架的复杂性和它们在当前不成熟领域中的作用。 作者将LLM框架比作80年代的ORM(对象关系映射),它们都是抽象层,旨在简化数据库操作。但作者认为LLM框架过于复杂,可能会阻碍用户 icon
  • 最近有个投资人非要拉我帮忙调查家创业公司,你猜怎么着?他们居然觉得靠"微调"就能让AI系统自动更新知识!好家伙,这还有人相信微调是万能仙丹呢? 来咱们掰扯掰扯。现在好多人都把微调大模型当成给手机充电——插上数据线就能往AI脑子里灌新知识?大错特错! icon
  • 我是一名拥有8年以上经验的高级技术主管,在过去的3年里,我一直致力于构建LLM驱动的系统- RAG管道,代理应用程序,text 2SQL引擎。我们已经在制造业、体育分析、非政府组织、法律的等领域推出了真实的的产品。 在一次又一次地这样做之后,我厌倦了同样的 icon
  • AI圈炸锅了!"RAG已死"是标题党还是真凉了? 问:RAG这技术是不是凉透了?问:网上都在传"RAG已死",那我做AI应用是不是该躲着RAG走? 最近好多程序员 icon
  • 人工智能搜索工具 Perplexity 正在为其 Pro 和 Enterprise Pro 订阅用户推出一项新的“内部知识搜索”功能。此功能允许用户同时搜索公共网络内容和内部知识库,从而有可能加快信息检索速度。 首席执行官 Aravind Srinivas icon
  • 关于如何实现Anthropic的上下文检索技术并结合异步处理的博客文章。这篇文章来自Instructor网站,讨论了在RAG(Retrieval-Augmented Generation)系统中,如何通过上下文检索技术来保留关键上下文信息,从而提高检索效率。 icon