律师事务所本地模型案例

有人昨日发帖，人说他刚刚和一家中型律师事务所签了一个35000美元的大单子。他们要为这家事务所搭建一个完全私密的人工智能系统，用的是LLAMA 3 70B这个模型，完全自己托管，不使用第三方API，还符合严格的法律数据政策。他们用n8n这个工具来把所有东西连接起来。

这个系统会是一个完整的内部系统，有点像他们自己的GPT4级别的法律分析工具，可以处理内部的案件、文件和合同，回答复杂问题，还能总结文件，而且不会暴露给OpenAI或Anthropic这些公司。

他们需要控制、隐私和自动化，不想雇一个内部的AI团队。

他们要用的技术栈包括：
• LLAMA 3 70B模型（量化并用vLLM加速）
• 在CoreWeave上用两块A100 GPU私密托管
• ChromaDB作为向量存储来处理文档嵌入和检索
• LlamaIndex来支持一个RAG（检索增强生成）流程，实现实时的问答和处理案件文件
• n8n来自动化从文档上传到Slack/邮件通知的所有事情
• 一个简单但干净的Streamlit网页界面，让员工可以和模型聊天，问问题，还能立刻得到总结

所有这些都在一个安全的环境中，有JWT认证、IP访问控制和完整的审计日志。