利用大语言模型辅助领域建模

对于生成式人工智能系统来说,在复杂的现实世界领域中航行是一项艰巨的挑战。不过,现在一种很有前途的方法照亮了前进的道路。

通过首先深入理解数据,我们可以将原始输入转化为经过验证的结构,从而优化人工智能推理。映射到关键任务的特定领域建模就像一个解释透镜,能将噪音提炼成重点信号。

复杂的归纳技术可以放大有限的数据,让人工智能的想象力填补人类注释无法触及的空白。专家知识注入可引导推理,同时还能灵活学习新模式。

量身定制的提示为自由流动的模型提供了有效的约束条件,同时又不影响流畅性。人工智能系统能够应对复杂性,结构化但不受约束。

这种方法为释放人工智能在各专业领域的潜力指明了新的方向。将领域转换、归纳增强和结构化生成结合起来,有望为模型注入严谨的推理能力,使其与现实世界的复杂性相适应。

过去的方法论在复杂性的网络中摇摇欲坠。但通过让数据本身成为指南针,我们可以引导人工智能系统达到有价值的新高度。这个框架提供了一张通往机器与人类知识交汇的新领域的地图。人工智能终于可以穿越错综复杂的现实世界。

1.构建特定领域的大型语言模型

  • - 利用基于提示的微调功能,针对目标领域调整预训练的 LLM
  • - 确定涉及理解和预处理数据的关键子任务
  • - 针对这些任务训练模型,将原始输入映射到结构化表征中

2.开发归纳式数据增强技术

  • - 使用新模型输出作为未标记数据的伪标签
  • - 通过归纳推理模块(FAP、FAE、FADOM)完善标签
  • - 不断修正模型并增加训练数据

3.纳入相关领域知识

  • - 添加专家系统、数据库、本体论等来指导模型训练
  • - 在提示和推理模块中注入知识

4.生成定制输出

  • - 将经过领域预处理的提示反馈给最终生成 LM
  • - 根据原始输入生成有针对性的输出

这种由领域专业建模、归纳增强、知识整合和结构化提示组成的框架,提供了一种可在医疗保健、法律、工程等领域通用的方法。
关键在于了解领域数据特征,并将原始输入映射到适合人工智能推理的有效结构。

案例《以数据为中心的金融大语言模型
介绍了金融大语言模型 (FLLM) 训练的三个关键子任务:

事件匹配和类比:

  • - 该子任务涉及将输入的新闻/事件与金融数据库中的相关资料进行匹配。
  • - 目标是找到与输入内容相关的类比案例、报告和示例。
  • - FLLM 会学习当前事件与之前相关示例之间的关联。
  • - 评估指标是准确匹配事件和材料的精确度、召回率和 F1 分数。

观点质量评估:

  • - 该子任务评估匹配材料中观点、分析和看法的质量。
  • - FLLM 学会对匹配的句子进行评分,并过滤掉低质量、不相关或有偏见的观点。
  • - 模型只选择最有见地的语句。
  • - 句子质量分类的准确性是评价指标。

要点提取:

  • - 该子任务从所选材料中提取高层次细节。
  • - 其中包括行业、关键指标、情感、评价维度等。
  • - 目标是构建一个结构化的关键点摘要。
  • - 提取细节的准确性和摘要质量的 BLEU 分数是衡量指标。

总之,这些子任务旨在匹配相关数据、过滤噪音和提取关键细节,是理解和预处理金融文本的不同方面。多任务学习开发了 FLLM 的金融推理能力。

归纳扩充推理(AAR)模块

  • - AAR 采用 ChatGPT 和 GPT-4 等大型语言模型来驱动推理过程。
  • - 这些基础模型通过任务描述的提示,实现了基于自然语言的归纳推理。
  • - 在 FAP 模块中,LLM 根据 FLLM 的初始输出动态生成分析问题。
  • - 对于 FAE,LLM 基于注入的领域知识,以稳健、一致的方式回答问题。
  • - 对于 FADOM,LLM 通过自然语言修改将原始输出与问答融合在一起。
  • - 通过格式化的提示工程,将外部领域的专门知识纳入每个 AAR 模块。 例如,在提示上下文中提供了相关的金融数据库和规则。
  • - 大模型的语义推理能力使他们能够根据这些领域知识做出合理的归纳推理。
  • - AAR 的实施不需要手工创建符号规则或知识库。
  • - 与之前的符号方法相比,自然语言交互使数据扩增更具可扩展性。
  •  对不同的 LLM 进行了端到端 AAR 稳定性评估,GPT-4 表现出了最稳健的性能。

总之,AAR 是通过提示和与 LLM 的自然语言交互而不是符号逻辑编程来实现的,充分利用了 LLM 在推理能力方面的最新进展。

AAR 模块的提示示例
1、FAP - 生成分析问题:
原文:"为应对高通胀,美联储昨天将利率上调了 0.75%"。
初级 FLLM 输出:"加息将导致抵押贷款利率上升,从而降低住房的可负担性。"

FAP 提示"请查看原文和初始输出。生成 3-5 个分析问题,以进一步检查输出的逻辑,找出差距,并引出更完整的财务分析"。
FAP 输出:"抵押贷款利率上升会对房屋销售和房屋库存产生什么影响?总体利率会上升多少?这会如何影响不同收入群体的购房承受能力?

2、FAE - 利用领域知识回答问题:
FAP 问题:"抵押贷款利率上升会对房屋销售和房屋库存产生什么影响?利率总体上会增加多少?
FAE 提示:"请根据抵押贷款专业知识,稳健地回答分析问题。考虑对需求、违约和住房供应的影响"。
FAE 输出:"利率上升可能会大幅降低购房者的需求,导致房屋销售下降。但需求下降最终可能会增加住房库存。总体抵押贷款利率可能上升 1-2 个百分点。

3、FADOM - 融合质量保证与原始输出:
原始输出:"加息将导致抵押贷款利率上升,从而降低住房的可负担性"。
FAP 问题与 FAE 答案:[见上文]
FADOM 提示:"以连贯的方式将原始输出与问答对整合起来,以改进分析"。
FADOM 输出:"加息将使抵押贷款利率上升约 1-2 个点。由于需求下降,这可能会减少房屋销售。然而,随着时间的推移,需求下降可能会增加住房库存。因此,可负担性可能取决于收入群体"。