大模型涌现的架构技术栈一览表

大型语言模型（LLM）应用程序堆栈的参考架构：

1、数据管道

Databricks 用于构建、部署和维护企业数据解决方案的统一数据平台，包括专为人工智能设计的产品（如 MosaicML 和 MLflow）；
Airflow 数据管道框架，用于以编程方式编写、安排和监控数据管道和工作流程，包括 LLMs ；
Unstructured.io 用于预处理 PDF、HTML 和 Word 文档等文档的开源组件，可与 LLM 应用程序配合使用；
Fivetran 该平台可从各种来源提取、加载和转换数据，用于分析、人工智能和运营；
Airbyte 一个开源数据集成引擎，可帮助整合数据仓库、湖和数据库中的数据；
Anyscale 这是一个人工智能计算平台，允许开发人员使用 Ray 来扩展数据摄取、预处理、嵌入和推理计算。

2、嵌入模型

OpenAI Ada Embedding 2 OpenAI 最受欢迎的嵌入模型，用于捕捉文本中的语义关系；
Cohere AI 一家独立的 LLM 商业供应商，尤其专注于语义搜索、主题聚类和垂直应用的嵌入；
Sentence Transformers 用于句子、文本和图像嵌入的开源 Python 框架

3、矢量数据库

Pinecone 一个可管理的云原生向量数据库，为高性能人工智能应用提供简单的应用程序接口；
Weaviate 这是一个开源矢量数据库，可同时存储对象和矢量；
ChromaDB 面向开发人员的人工智能原生开源嵌入式数据库平台；
Pgvector 适用于 Postgres 的开源矢量相似性搜索，允许精确和近似的近邻搜索；
Zilliz (Milvus) 一个开源矢量数据库，专为开发和维护人工智能应用程序而构建；
Qdrant 矢量数据库和矢量相似性搜索引擎；
Metal io 为开发人员提供托管服务，帮助他们利用 ML 嵌入构建应用程序；
LanceDB 用于人工智能应用的无服务器向量数据库

4、游乐场

OpenAI Playground 一个基于网络的平台，用于实验 OpenAI 开发的各种机器学习模型
nat.dev 该平台可让用户使用多种语言模型测试提示，并比较其性能
Humanloop 帮助开发人员在 LLM 上构建应用程序的平台
Parea AI 为人工智能工程师提供平台和 SDK，用于 LLM 评估、可观察性和版本控制的增强型 prompt playground。

5、协调者

Langchain 这是一个开源库，为开发人员提供了构建由 LLM 支持的应用程序的工具；
LlamaIndex 用于 LLM 应用程序的数据框架，可用于采集、构建和访问私有数据或特定领域数据；
Autogen 为复杂的人工智能应用提供一个框架，利用可定制、可对话的代理来自动化和简化 LLM 工作流程；
Microsoft Semantic Kernel 轻量级开源协调 SDK ；
Vercel AI SDK 一个开源库，供开发人员使用 JavaScript 和 TypeScript 构建流式用户界面； (node/npm)
Vectara AI 利用您自己的数据进行人工智能对话的搜索和发现平台； N/A
ChatGPT 一款人工智能聊天机器人，利用自然语言处理技术创建类似人类的对话

6、APIs / Plugins

Serp API 用于访问 Google 搜索结果的实时 API，以及处理代理、解决验证码和解析结构化数据；
Wolfram Alpha API 一个基于网络的应用程序接口，提供计算和演示功能，可集成到各种应用程序中 N/A .NET；
Zapier API AI Plugin 该插件可让您连接 5000 多款应用程序，并直接在 ChatGPT 中与它们互动

7、LLM Caches

Redis 一种内存数据结构存储，可用作数据库、缓存、消息代理和流引擎；
SQLite 一个独立、无服务器、零配置、事务型 SQL 数据库引擎；
GPTCache 这是一款开源工具，可通过实施缓存来存储响应，从而提高基于 GPT 的应用程序的效率和速度

更多点击标题

关于上下文情境学习的设计模式
情境学习是指使用现成的大模型，并通过巧妙的提示和对私人“情境”数据的调节来控制其行为。文章还介绍了情境学习的工作流程，包括数据预处理/嵌入、提示构造/检索和提示执行/推理。

上下文数据的加载和转换解决方案，以及情境学习中可能遇到的问题和应对策略。