Arch：一个智能提示网关

#AI智能体Agent #API网关代理 #大语言模型LLM #Envoy

2024-10-16 banq

Arch 是一个智能的第 7 层网关，旨在使用您的 API 保护、观察和个性化 LLM 应用程序（代理、助手、副驾驶）

用（快速）LLM 设计，可实现安全处理、强大的可观察性以及提示与 API 的无缝集成 - 所有这些都在业务逻辑之外。
由 Envoy 代理的核心贡献者在 Envoy 上构建。

Arch 采用专门构建的 LLM 设计，可处理与提示处理相关的关键但未分化的任务，包括检测和拒绝越狱尝试、智能地调用“后端” API 来满足提示中所代表的用户请求、路由到上游 LLM 并提供上游 LLM 之间的灾难恢复，以及以集中方式管理提示和 LLM 交互的可观察性。

Arch 是基于Envoy Proxy构建的（也是由其核心贡献者构建的），其理念如下：
提示是细微且不透明的用户请求，它们需要与传统 HTTP 请求相同的功能，包括安全处理、智能路由、强大的可观察性以及与后端（API）系统的集成以实现个性化——所有这些都在业务逻辑之外。*

核心功能：

基于Envoy构建：Arch 与应用服务器一起运行，并建立在 Envoy 经过验证的 HTTP 管理和可扩展性功能之上，以处理与提示和 LLM 相关的入口和出口流量。
函数调用，用于快速运行 Agentic 和 RAG 应用程序。采用专门构建的LLM设计，可处理快速、经济高效且准确的基于提示的任务，例如函数/API 调用和从提示中提取参数。
提示防护：Arch 集中提示防护栏以防止越狱尝试并确保安全的用户交互，而无需编写任何代码。
流量管理：Arch 管理 LLM 调用，提供智能重试、自动切换和弹性上游连接以实现持续可用性。
基于标准的可观察性：Arch 使用 W3C Trace Context 标准实现跨应用程序的完整请求跟踪，确保与可观察性工具的兼容性，并提供监控延迟、令牌使用情况和错误率的指标，帮助优化 AI 应用程序性能。