宣布 LlamaCloud 正式可用 (以及我们的 1900 万美元 A 轮融资)!
LlamaIndex

LlamaIndex 2024-11-19

LlamaIndex 新闻通讯 2024-11-19

你好,Llama 关注者们! 🦙

欢迎阅读本周的 LlamaIndex 新闻通讯!我们很高兴分享关于动态章节检索的更新、一种用于连贯文档检索的新 RAG 技术,以及 ColPali 的集成以增强多模态 RAG 结果。本期还包含 create-llama 的发布,其中包含一个用于 Typescript 应用的“表单填充”智能体,以及一个构建结合文本和图像的多媒体研究报告生成器的指南。请勿错过这些更新以及社区提供的有趣的用例和教程。

如果您还没有探索过 LlamaCloud,请务必注册与我们联系,讨论您的特定企业用例。

🤩 重点内容:

  • 引入动态章节检索:一种新的 RAG 技术,通过元数据和两阶段检索过程,连贯地获取整个文档章节。手册, 推文
  • 集成 ColPali 用于多模态 RAG: ColPali 作为重排器,结合 Cohere 的多模态嵌入和 ColPali,实现精确的文本和图像结果。手册, 推文
  • Create-Llama v0.3.12 发布:新版本包含一个“表单填充”智能体,简化了 Typescript 应用的 LlamaIndex 工作流集成。推文
  • 多媒体研究报告指南:一份教程,介绍如何使用基于智能体的 RAG 工作流,从复杂文档中生成结合文本和图像的结构化报告。手册, 推文

🗺️ LlamaCloud 和 LlamaParse

  • 我们引入了动态章节检索,这是一种新的 RAG 技术,通过确保连贯地获取文档的整个章节来增强检索。这种方法从简单的页面级分块开始,添加章节元数据,并通过两阶段检索过程完成,以保持上下文的连续性。手册, 推文
  • 一份创建多媒体研究报告生成器的指南,该生成器将复杂文档中的洞察整合为结合文本和图像的结构化报告,利用结构化输出的潜力进行基于智能体的 RAG 和报告生成工作流。手册, 推文
  • 一份使用 LlamaCloud 和 OpenAI GPT-4o 创建多智能体工作流的指南,用于从 10K 文档生成结构化财务报告,展示了文本、表格和图表的高级检索,并详细介绍了生成最终结构化分析所需的研究员和撰写步骤。推文
  • 我们发布了一篇博客文章和视频,详细介绍了高级报告生成的构建模块,强调了结构化输出、高级文档处理、知识库集成、多智能体工作流和模板系统如何自动化复杂的文档创建,为团队节省每份报告 10-15 小时。视频, 博客文章, 推文

✨ 框架

  • 我们集成了 ColPali 作为重排器,用于构建多模态 RAG,确保在文本和图像模态中都获得高度相关的结果。我们使用 Cohere 的多模态嵌入进行初步检索,并分别使用 Cohere 和 ColPali 对文本和图像进行重排,然后再生成响应。手册, 推文
  • 我们发布了 create-llama v0.3.12,其中包含一个“表单填充”智能体,简化了 Typescript 应用的 LlamaIndex 工作流集成。推文
  • 我们在 Python 文档中推出了一个新的“问 AI”小部件,由 RunLLM 提供支持,该小部件具有一个基于智能体的 RAG 系统,可以直接响应用户查询,提供准确、最新的编码解决方案。推文
  • 我们与最新的 Mistral Pixtral 模型 - Pixtral-large 进行了迅速集成。文档, 推文

💡 用例:

  • PureML 利用 LlamaIndex 和 Reflex 的大型语言模型,通过自动化清洗、智能特征创建和数据整合来增强 ML 数据集管理。博客文章
  • PursuitGov 使用 LlamaParse 改造其 B2G 服务,在一个周末解析了 400 万页,提高了文档准确性,并使客户能够发现公共部门数据中的机会。博客文章
  • RAGformation,一个可以根据自然语言描述自动生成云配置的工具,包含可视化流程图、价格估算和可定制的建议。博客文章

✍️ 社区

  • Ravi Theja 关于使用 ColPali 作为重排器的多模态 RAG 视频教程
  • Lingzhen Chen 关于构建 Llamaindex 工作流交互式用户界面的教程
  • Fermin Blanco 关于使用 Llamaindex 从非结构化文档中提取结构化数据的教程
  • 关于使用 NVIDIA NIM 和 LlamaIndex 构建基于智能体的 RAG 查询引擎的教程
  • 关于为 RAG 系统构建上下文细化智能体的教程

🎙️网络研讨会:

  • 加入我们参与 Memgraph 社区电话会议,我们将探索使用 LlamaIndex 和 Memgraph 构建强大的 GraphRAG 应用。
  • 加入我们参加 11 月 27 日与 AIMakerspace 合作举办的实践工作坊,使用开源大型语言模型构建本地基于智能体的 RAG 应用。向专家 Greg Loughnane 博士和 Chris Alexiuk 学习如何设置“本地部署”的大型语言模型应用堆栈。