Laurie Voss • 2025-05-08

LlamaParse 2025年5月更新：新模型、倾斜检测及更多功能

我们始终在改进 LlamaParse，这款业界领先的复杂文档格式解析器。以下是我们最近发布的一系列新功能和用户体验改进。

新模型

我们正在持续扩展我们最先进的代理式解析模式可用的模型选择。我们现在支持 OpenAI 的 GPT 4.1 和 Google 的 Gemini 2.5 Pro。这两款模型在我们的测试中均取得了出色的结果，在解析 PDF、PowerPoint 和 Word 文档等复杂文档时，可以提供最先进的准确性。

如果文档扫描时颠倒或横向放置，您的文档解析可能会完全失败。为避免这种失败模式，现在可以自动检测并以正确的方向解析旋转 90º、180º 或 270º 的页面。

更微妙的是，轻微的倾斜——偏离水平线 1º 到 12º 的角度——也可能导致解析结果不佳，因此我们会检测这些情况并自动将其垂直对齐，以便能够以最高可能的准确性进行解析。

当然，如果两种情况都存在——例如，您的文档是横向的但也倾斜了，旋转了 93º——我们也会同时纠正！

您的结果的 JSON 输出包含一个新属性 originalOrientationAngle，该属性会告诉您是否进行了这种纠正。

我们现在为每个解析的页面提供置信度分数。工作原理如下

置信度分数范围从 0 到 1，分数越高越好。任何低于约 0.2 的分数都会被自动标记为低置信度。您将在所有模式（Fast 和 LVM 除外）的 JSON 结果中找到这些分数。

您现在可以指定您偏好的解析页面错误容忍度，用 0 到 1 之间的数字表示错误百分比。page_error_tolerance 是在作业失败前，转换为 Markdown 失败的最大页面数。要使用它，在使用 API 时设置 pageErrorTolerance="$value"。

如果 LlamaParse 未能将页面转换为 Markdown，您现在可以通过在 API 中设置 replace_failed_page_mode="$value" 为以下三个支持值之一，对 API 如何处理此问题拥有更大的控制权

以上就是我们最新的更新内容！LlamaParse 每月提供 10,000 页的免费额度，您可以轻松登录 LlamaCloud 开始您的解析项目。