宣布 LlamaCloud 正式发布(以及我们的1900万美元A轮融资)!
LlamaIndex

Laurie Voss 2025-05-08

LlamaParse 2025年5月更新:新模型、倾斜检测及更多功能

我们始终在改进 LlamaParse,这款业界领先的复杂文档格式解析器。以下是我们最近发布的一系列新功能和用户体验改进。

新模型

我们正在持续扩展我们最先进的代理式解析模式可用的模型选择。我们现在支持 OpenAI 的 GPT 4.1 和 Google 的 Gemini 2.5 Pro。这两款模型在我们的测试中均取得了出色的结果,在解析 PDF、PowerPoint 和 Word 文档等复杂文档时,可以提供最先进的准确性。

自动方向和倾斜检测

如果文档扫描时颠倒或横向放置,您的文档解析可能会完全失败。为避免这种失败模式,现在可以自动检测并以正确的方向解析旋转 90º、180º 或 270º 的页面。

更微妙的是,轻微的倾斜——偏离水平线 1º 到 12º 的角度——也可能导致解析结果不佳,因此我们会检测这些情况并自动将其垂直对齐,以便能够以最高可能的准确性进行解析。

当然,如果两种情况都存在——例如,您的文档是横向的但也倾斜了,旋转了 93º——我们也会同时纠正!

您的结果的 JSON 输出包含一个新属性 originalOrientationAngle,该属性会告诉您是否进行了这种纠正。

置信度分数

我们现在为每个解析的页面提供置信度分数。工作原理如下

  • 纯文本页面: 我们通过平均字符计数比例、字母袋重叠度和词袋重叠度来比较原始页面和 Markdown。
  • 包含图片的页面: 我们运行 OCR,只保留高置信度的文本,并检查其中有多少出现在 Markdown 中以查找缺失内容。

置信度分数范围从 0 到 1,分数越高越好。任何低于约 0.2 的分数都会被自动标记为低置信度。您将在所有模式(Fast 和 LVM 除外)的 JSON 结果中找到这些分数。

页面错误容忍度

您现在可以指定您偏好的解析页面错误容忍度,用 0 到 1 之间的数字表示错误百分比。page_error_tolerance 是在作业失败前,转换为 Markdown 失败的最大页面数。要使用它,在使用 API 时设置 pageErrorTolerance="$value"

替换失败页面模式

如果 LlamaParse 未能将页面转换为 Markdown,您现在可以通过在 API 中设置 replace_failed_page_mode="$value" 为以下三个支持值之一,对 API 如何处理此问题拥有更大的控制权

  • raw_text:返回页面的原始文本而不是 Markdown(这是默认设置)
  • blank_page:返回一个空白页面。
  • error_message:返回一个错误消息,解释页面失败的原因。

持续改进

以上就是我们最新的更新内容!LlamaParse 每月提供 10,000 页的免费额度,您可以轻松登录 LlamaCloud 开始您的解析项目。