宣布 LlamaCloud 全面上线(以及我们的 1900 万美元 A 轮融资)!
LlamaIndex

LlamaIndex 2024-06-04

LlamaIndex 周报 2024-06-04

你好,LlamaIndex 大家庭!🦙

我们很高兴再次与您联系,并为您带来 LlamaIndex 世界的最新、最精彩内容。本周,我们激动地推出一系列更新和多样化的内容,旨在提升您的 LlamaIndex 体验,特别是在处理知识图谱时。从集成和指南到演示和教程,我们为您提供了所需的所有工具和见解。

🤩 重点内容:

  • 提升知识图谱: LlamaIndex 中引入的属性图谱索引(Property Graph Index)改变了知识图谱(KG)的构建和查询方式。这个强大的工具包通过向量能力增强了图谱搜索。文档推文
  • 使用 LlamaParse 获取电子表格洞察: LlamaParse 现在支持电子表格解析,将复杂的 Excel 文件转换为对 LLM 友好的表格,从而提高性能和数据处理能力。Notebook推文
  • 使用 Codestral 生成代码: Codestral,MistralAI 的一个尖端模型,现已集成到 LlamaIndex 中。这个代码生成工具支持 80 多种编程语言。文档推文

✨ 功能发布与增强

  1. 我们引入了属性图谱索引(Property Graph Index),这是一个重要功能,将 LlamaIndex 确立为使用 LLM 构建知识图谱(KG)的首要框架。这个复杂的工具包支持知识图谱的构建和查询,即使在缺少原生向量支持的图存储中,也能进行联合向量和图谱搜索。文档推文
  2. 我们在 LlamaParse 中推出了对电子表格解析的支持,允许您将复杂的 Excel 文件和其他电子表格格式转换为干净、对 LLM 友好的表格,从而提高 RAG 流水线的性能。Notebook推文
  3. 我们将 MistralAI 的 Codestral 集成到 LlamaIndex 中,为这个经过 80 多种编程语言训练的尖端代码生成模型提供首日支持。文档推文
  4. 我们将 PostgresML 集成到 LlamaIndex 中,对于喜欢 Postgres 并希望构建 AI 应用的用户来说非常完美。它可以在本地提供开源模型服务,处理 embeddings,并允许您直接在 Python 和 JavaScript 中训练或微调模型。博客文章推文
  5. 我们集成了 Milvus Lite,为向量搜索提供了一个简单的起点,并为 LlamaIndex 提供了首日支持。文档推文

🗺️ 指南

  • 关于构建自定义图谱检索器的指南,通过结合向量搜索和图谱搜索,并进行重排序以提高结果,为您的特定需求创建自定义图谱检索器。
  • 关于使用 NVIDIA NIM 推理微服务在几分钟内构建 GenAI 应用的指南,这提供了一种简单快速的方式来部署 GenAI 应用。本逐步指南教您如何运行模型、生成 embeddings 并重新排序数据以获得最佳结果。
  • 关于使用 LLM 构建知识图谱的指南,使用本地模型和 Neo4j 构建知识图谱,从定义实体和关系开始,使用 SchemaLLMPathExtractor 创建结构化图谱,并通过查询发现洞察。

🖥️ 演示

  • Omakase RAG OrchestratorAmir Mehr 开发的一个项目,是一个 Web 应用模板,旨在帮助您使用 Django、LlamaIndex 和 Google Drive 构建可扩展的 RAG 应用。它包含一个功能齐全的 RAG API、数据源管理、用户访问控制和管理面板。
  • gmail-extractor 是 Laurie 的一个项目,它使用 LLM 训练一个 Python 脚本,以从 Gmail 中提取结构化数据。通过根据电子邮件数据迭代改进脚本,LLM 可以有效地修改和增强脚本,以精确提取信息。

✍️ 教程

  • Sherlock Xu 在 BentoML 上的教程:将 LlamaIndex RAG 应用作为 REST API 提供服务。

📑 论文

  • Jian Chen 及其团队引入了一个新的基准数据集 FinTextQA,用于长篇金融问答。该基准使用 LlamaIndex 的 Auto-Merging 和 Sentence Window Retrievers 以及各种 embeddings、重排序器和 LLM 进行了评估,提供了一个全面的金融文本问答系统。

📹 网络研讨会

  • 与 memary 作者 Julian Saks、Kevin Li、Seyeong Han 的网络研讨会。Memary 是自主代理长期记忆的完整开源参考实现。

📅 活动:

  • 加入来自 LlamaIndex 的 Pierre 以及 Weaviate 和 Weights & Biases 的演讲者,于 6 月 12 日在伦敦 NLP Meetup 参加活动,重点讨论在生产环境中使用 LLM 处理金融服务数据面临的挑战和解决方案。加入