宣布 LlamaCloud 正式发布(以及我们的 1900 万美元 A 轮融资)!
LlamaIndex

LlamaIndex 2025-01-09

引入 Agentic 文档工作流

我们以引入一种将智能体应用于文档之上的新架构来开启 2025 年:Agentic 文档工作流 (ADW)。该架构结合了文档处理、检索、结构化输出和智能体编排,以实现端到端知识工作的自动化。这超越了传统的智能文档处理 (IDP) 和 RAG 范式,它们分别侧重于孤立的小步骤(提取和问答),Agentic 文档工作流有助于实现智能体大幅提高知识生产力的承诺。

超越基础 RAG

尽管 RAG 已成为将大型语言模型 (LLM) 落地到企业数据的强大模式,但许多实际的文档工作流需要更复杂的编排。考虑一个典型的合同审查工作流:分析师需要提取关键条款、交叉引用监管要求、识别潜在风险并生成合规建议。这不仅需要信息检索,还需要结构化推理和决策支持。

传统方法通常难以处理超出简单提取或匹配的复杂工作流。在实际组织中

  • 文档并非孤立存在——流程涉及合同、政策、电子邮件和表格的协同工作
  • 决策跨越多个步骤——从数据提取到验证、批准再到建议
  • 必须在整个流程中保持上下文和状态
  • 多个系统需要协调——解析器、检索器和业务逻辑引擎

Agentic 文档工作流 (ADW) 通过将文档视为更广泛业务流程的一部分来解决这些挑战。ADW 系统可以在步骤之间保持状态,应用业务规则,协调不同组件,并根据文档内容采取行动——而不仅仅是分析它。

构建智能文档智能体

我们开发了一套参考架构,展示了如何将 LlamaCloud 的企业级解析和检索能力与智能智能体相结合。每个架构都展示了如何构建能够理解上下文、保持状态并驱动多步骤流程的系统。

每个工作流的核心是一个文档智能体,它负责编排整个过程。这些智能体

  • 使用 LlamaParse 从输入文档中提取和结构化信息
  • 维护关于文档上下文和流程阶段的状态
  • 从知识库 (LlamaCloud) 中检索并分析相关参考资料
  • 根据业务规则生成可操作的建议

通过在整个流程中保持状态,智能体可以处理超出简单提取或匹配的复杂多步骤工作流。这种方法使它们能够在处理文档时建立深度的上下文,同时协调不同系统组件之间的工作。

让我们通过一些真实的示例用例来探索这一点。这些以及其他用例也可以直接作为 notebook 资源获取。

合同审查:智能合规分析

合同审查工作流展示了文档智能体如何跨多个文档执行复杂的分析。在分析供应商协议时,智能体解析复杂的合同结构,识别关键条款,并将其与存储在 LlamaCloud 中的监管要求知识库进行匹配。

这使其能够发现潜在的合规问题,并提供关于需要人工审查领域的结构化建议——例如非标准条款、缺失条款或可能与法规冲突的条款。该系统作为智能助手,帮助法务团队更高效地工作,同时确保人类对最终决策拥有完全控制权。

患者病例摘要:情境理解

医疗文档数量的爆炸式增长带来了独特的挑战,同时也展示了智能文档处理在加速医生工作方面的力量。我们的患者病例摘要智能体不仅从医疗记录中提取信息,还可以将相关的病情、治疗和结果分组,从而辅助诊断和治疗。

该工作流可以解析复杂的医疗文档,包括实验室结果和临床笔记,同时保持患者病史的关键上下文。通过将这些信息与存储在 LlamaCloud 中的医疗指南进行匹配,智能体可以生成全面的病例摘要,突出显示供医生审查的关键临床见解。

发票处理:优化业务运营

我们的发票处理工作流展示了智能智能体如何为日常任务添加商业智能。该智能体超越了基本的数据提取,支持基于供应商协议和早付折扣来优化支付时间。

结合 LlamaParse 精确提取明细项和支付条款的能力,以及 LlamaCloud 的检索能力,智能体可以对照合同费率验证定价,并建议最优支付策略。这将一个简单的文档处理任务转变为一个营运资本优化的工具。

汽车保险理赔处理:结构化分析支持

我们的汽车保险理赔工作流展示了智能文档处理如何支持(而非取代)人类在复杂流程中的决策。该智能体通过组织和结构化来自多个文档的信息来帮助理赔处理人员:解析传入的理赔表格,匹配保单文档的相关部分,并以清晰的格式呈现关键细节。

重要是,该系统旨在增强人类专业知识,而非做出最终决策。它通过展示相关的保单细节和组织信息来帮助理赔处理人员,同时将所有承保和理赔决定权牢牢掌握在人类手中。这展示了人工智能如何在敏感领域简化流程,同时保持适当的人工监督。

构建生产就绪的解决方案

这些示例都以详细的 Jupyter notebook 形式实现,您可以运行和修改。这些工作流展示了我们生产级文档处理的方法:将 LlamaParse 的高级文档理解能力与 LlamaCloud 的强大检索能力以及我们的智能体框架相结合。

这些 notebook 展示了如何处理实际复杂性,例如错误处理、验证和可扩展性。它们旨在作为您自己实现方案的起点,提供了清晰的示例,说明如何针对您的特定用例定制逻辑。

开始使用

我们看到各行业的企业正在采用这些超出基础聊天机器人的更高级模式。准备好开始构建了吗?您可以

在接下来的几周里,我们将宣布大量新功能发布和教育性深度解析,让您能够为越来越多的用例构建生产级 Agentic 文档工作流。敬请关注!