​​​​​​​大模型涌现的架构技术栈一览表


大型语言模型(LLM)应用程序堆栈的参考架构:

1、数据管道

  • Databricks    用于构建、部署和维护企业数据解决方案的统一数据平台,包括专为人工智能设计的产品(如 MosaicML 和 MLflow);
  • Airflow    数据管道框架,用于以编程方式编写、安排和监控数据管道和工作流程,包括 LLMs            ;
  • Unstructured.io  用于预处理 PDF、HTML 和 Word 文档等文档的开源组件,可与 LLM 应用程序配合使用;
  • Fivetran    该平台可从各种来源提取、加载和转换数据,用于分析、人工智能和运营 ;      
  • Airbyte    一个开源数据集成引擎,可帮助整合数据仓库、湖和数据库中的数据        ;
  • Anyscale    这是一个人工智能计算平台,允许开发人员使用 Ray 来扩展数据摄取、预处理、嵌入和推理计算。

2、嵌入模型

  • OpenAI Ada Embedding 2    OpenAI 最受欢迎的嵌入模型,用于捕捉文本中的语义关系 ; 
  • Cohere AI   一家独立的 LLM 商业供应商,尤其专注于语义搜索、主题聚类和垂直应用的嵌入 ;       
  • Sentence Transformers    用于句子、文本和图像嵌入的开源 Python 框架

3、矢量数据库

  • Pinecone   一个可管理的云原生向量数据库,为高性能人工智能应用提供简单的应用程序接口   ; 
  • Weaviate   这是一个开源矢量数据库,可同时存储对象和矢量;
  • ChromaDB    面向开发人员的人工智能原生开源嵌入式数据库平台        ;
  • Pgvector    适用于 Postgres 的开源矢量相似性搜索,允许精确和近似的近邻搜索 ;       
  • Zilliz (Milvus)    一个开源矢量数据库,专为开发和维护人工智能应用程序而构建   ;    
  • Qdrant   矢量数据库和矢量相似性搜索引擎;   
  • Metal io   为开发人员提供托管服务,帮助他们利用 ML 嵌入构建应用程序 ;    
  • LanceDB   用于人工智能应用的无服务器向量数据库

4、游乐场

  • OpenAI Playground   一个基于网络的平台,用于实验 OpenAI 开发的各种机器学习模型  
  • nat.dev    该平台可让用户使用多种语言模型测试提示,并比较其性能      
  • Humanloop   帮助开发人员在 LLM 上构建应用程序的平台 
  • Parea AI    为人工智能工程师提供平台和 SDK,用于 LLM 评估、可观察性和版本控制的增强型 prompt playground。

5、协调者

  • Langchain   这是一个开源库,为开发人员提供了构建由 LLM 支持的应用程序的工具;
  • LlamaIndex   用于 LLM 应用程序的数据框架,可用于采集、构建和访问私有数据或特定领域数据            ;
  • Autogen    为复杂的人工智能应用提供一个框架,利用可定制、可对话的代理来自动化和简化 LLM 工作流程       ;  
  • Microsoft Semantic Kernel   轻量级开源协调 SDK          ;
  • Vercel AI SDK   一个开源库,供开发人员使用 JavaScript 和 TypeScript 构建流式用户界面;      (node/npm)
  • Vectara AI   利用您自己的数据进行人工智能对话的搜索和发现平台;       N/A
  • ChatGPT    一款人工智能聊天机器人,利用自然语言处理技术创建类似人类的对话

6、APIs / Plugins

  • Serp API    用于访问 Google 搜索结果的实时 API,以及处理代理、解决验证码和解析结构化数据        ;
  • Wolfram Alpha API    一个基于网络的应用程序接口,提供计算和演示功能,可集成到各种应用程序中    N/A    .NET;
  • Zapier API AI Plugin    该插件可让您连接 5000 多款应用程序,并直接在 ChatGPT 中与它们互动

7、LLM Caches

  • Redis   一种内存数据结构存储,可用作数据库、缓存、消息代理和流引擎;
  • SQLite    一个独立、无服务器、零配置、事务型 SQL 数据库引擎            ;
  • GPTCache    这是一款开源工具,可通过实施缓存来存储响应,从而提高基于 GPT 的应用程序的效率和速度

更多点击标题

关于上下文情境学习的设计模式
情境学习是指使用现成的大模型,并通过巧妙的提示和对私人“情境”数据的调节来控制其行为。文章还介绍了情境学习的工作流程,包括数据预处理/嵌入、提示构造/检索和提示执行/推理。

上下文数据的加载和转换解决方案,以及情境学习中可能遇到的问题和应对策略。