宣布 LlamaCloud 正式发布(以及我们的 1900 万美元 A 轮融资)!
LlamaIndex

Jerry Liu 2024-09-19

隆重推出 LlamaParse Premium

LlamaParse 是市场上最适合您的上下文增强型 LLM 应用程序的文档解析器。自 2 月份推出以来,我们已处理超过 5000 万页文档,并在 PyPi 上获得了 100 万次以上的下载。它能够处理任何文档 - PDF、Powerpoint、Excel。我们还推出了多种不同的模式,从针对高效但准确的文本+表格处理进行优化的快速/准确模式,到利用最新多模态模型理解复杂视觉文档(如投资者演示文稿和产品手册)的多模态模式。

其中一个权衡点是,我们的快速/准确模式对于解析长文本和表格非常出色,但对于视觉内容则效果不佳;而我们的多模态模式对于视觉内容非常出色,但对于文本/表格则效果不佳。

今天,通过 LlamaParse Premium 模式,您可以获得两全其美的效果。Premium 模式利用最先进的多模态模型和启发式文本解析技术,从最复杂的文档中提取文本,性能优于 Sonnet-3.5 等基础模型。这使得用户能够构建上下文增强型 RAG/代理应用程序,并实现更高的准确性和更低的幻觉率。

立即试用。

主要功能

LlamaParse Premium 包含以下亮点:

  1. 将所有内容,从文本到表格再到图像,输出为结构良好的 Markdown 格式。
  2. 将图表转换为 Mermaid 格式(位于 mermaid 标签之间)
  3. 将公式转换为 LateX
  4. 大幅减少内容遗漏
  5. 为所有图像添加图注(位于 [ 和 ] 标签之间)
  6. 比精确模式更好地确定标题/副标题。

现有的 LlamaParse 功能,例如使用解析指令“提示”解析器,以及使用 Webhook 将解析的数据直接同步到您的应用程序,都可以通过 LlamaParse Premium 使用。

结果展示

让我们通过一些实际示例,展示 LlamaParse Premium 模式在复杂文档属性(表格、图表和阅读顺序)上的表现。

对于其中一些示例,我们将与原始 GPT-4o 和文本模式进行比较。

表格

当前的多模态模型很难从图像中提取长表格而不产生幻觉。LlamaParse Premium 能够绕过这些幻觉。

这是我们常用的加州列车时刻表示例,我们的 Premium 模式完美搞定!

来源:

GPT-4o

LlamaParse Sonnet

几乎完美,但模型漏掉了一些标题,并幻觉了一个值。

LlamaParse Premium

图表

LlamaParse Premium 输出 Mermaid 格式的图表,为大型语言模型提供紧凑的表示形式以便理解。

这使您的 RAG 管道能够回答文档中关于图表的问题。这是一个金融机构公司结构的示例。

渲染的 Mermaid 图表

公式

LlamaParse Premium 将公式输出为 LateX 格式,并放在 $$ 符号之间。

示例输入

输出的 Markdown

渲染的 Markdown

阅读顺序

多模态模型在开箱即用地识别文档阅读顺序方面表现出色,但往往会对文本本身产生幻觉。另一方面,传统的解析方法在解析文本方面表现良好,但无法理解复杂的顺序。

LlamaParse Premium 同时保留了这两点。这是 Xanax UK 的通知。尽管 LlamaParse Premium 和我们所有基准模型一样都漏掉了底部的表格,但它在准确模式(更好的阅读顺序,没有内容遗漏)和 gpt-4o(所有内容都与文档内容一致)方面都表现更佳。

来源

精确模式:存在阅读顺序问题,不同列的内容混杂在一起。

GPT-4o:阅读顺序似乎合理并保留了 4 列结构,但内容存在幻觉。

Sonnet 3.5:阅读顺序似乎合理并保留了 4 列结构,但内容存在幻觉(虽然比 GPT4o 少)。

Premium 模式:解决了阅读顺序和幻觉问题。遗憾的是,它漏掉了最后一个表格。

因此,与竞争解决方案相比,您的 RAG 管道可以更好地回答关于这些数据类型的问题。

我们已经在 多模态 notebooks 中展示了好的解析对于好的 RAG 的重要性。我们鼓励您使用 LlamaParse Premium 处理您的复杂文档,并比较 RAG 响应质量与基线解析方法在复杂数据上的表现。

下一步

LlamaParse Premium 模式基于最新的多模态模型运行——这意味着随着多模态模型能力提升(从 Sonnet-3.5 到 Pixtral、o1 等),LlamaParse Premium 的表现也会更好。当然,我们仍在积极维护和改进我们的其他解析模式。

目前每页价格为 7.5 美分。注意:这略高于我们的默认解析模式,因此如果您是首次试用,请先尝试一个小文档!

您可以立即试用 LlamaParse Premium。在此注册账户并访问解析 Playground:https://cloud.llamaindex.ai/parse。您可以在我们的解析 Playground 中直接查看解析结果,或者通过我们的 LlamaParse SDK 直接切换设置。

LlamaParse Premium 已集成到我们的企业级 RAG 平台 LlamaCloud 中。如果您有兴趣在企业环境中使用此功能,请与我们联系