
Laurie Voss • 2025-05-08
LlamaParse 2025年5月更新:新模型、倾斜检测及更多功能
我们始终在改进 LlamaParse,这款业界领先的复杂文档格式解析器。以下是我们最近发布的一系列新功能和用户体验改进。
新模型
我们正在持续扩展我们最先进的代理式解析模式可用的模型选择。我们现在支持 OpenAI 的 GPT 4.1 和 Google 的 Gemini 2.5 Pro。这两款模型在我们的测试中均取得了出色的结果,在解析 PDF、PowerPoint 和 Word 文档等复杂文档时,可以提供最先进的准确性。


自动方向和倾斜检测
如果文档扫描时颠倒或横向放置,您的文档解析可能会完全失败。为避免这种失败模式,现在可以自动检测并以正确的方向解析旋转 90º、180º 或 270º 的页面。
更微妙的是,轻微的倾斜——偏离水平线 1º 到 12º 的角度——也可能导致解析结果不佳,因此我们会检测这些情况并自动将其垂直对齐,以便能够以最高可能的准确性进行解析。
当然,如果两种情况都存在——例如,您的文档是横向的但也倾斜了,旋转了 93º——我们也会同时纠正!
您的结果的 JSON 输出包含一个新属性 originalOrientationAngle
,该属性会告诉您是否进行了这种纠正。
置信度分数
我们现在为每个解析的页面提供置信度分数。工作原理如下
- 纯文本页面: 我们通过平均字符计数比例、字母袋重叠度和词袋重叠度来比较原始页面和 Markdown。
- 包含图片的页面: 我们运行 OCR,只保留高置信度的文本,并检查其中有多少出现在 Markdown 中以查找缺失内容。
置信度分数范围从 0 到 1,分数越高越好。任何低于约 0.2 的分数都会被自动标记为低置信度。您将在所有模式(Fast 和 LVM 除外)的 JSON 结果中找到这些分数。
页面错误容忍度
您现在可以指定您偏好的解析页面错误容忍度,用 0 到 1 之间的数字表示错误百分比。page_error_tolerance
是在作业失败前,转换为 Markdown 失败的最大页面数。要使用它,在使用 API 时设置 pageErrorTolerance="$value"
。
替换失败页面模式
如果 LlamaParse 未能将页面转换为 Markdown,您现在可以通过在 API 中设置 replace_failed_page_mode="$value"
为以下三个支持值之一,对 API 如何处理此问题拥有更大的控制权
raw_text
:返回页面的原始文本而不是 Markdown(这是默认设置)blank_page
:返回一个空白页面。error_message
:返回一个错误消息,解释页面失败的原因。
持续改进
以上就是我们最新的更新内容!LlamaParse 每月提供 10,000 页的免费额度,您可以轻松登录 LlamaCloud 开始您的解析项目。