
LlamaIndex • 2024-12-09
使用 LlamaParse 自动模式优化解析成本
我们的世界级文档解析器,LlamaParse,是我们最受欢迎的产品之一,原因充分:它功能强大、灵活且无比准确。其灵活性的一方面在于其多种解析模式:您可以选择快速模式以获得最快可能的输出,连续模式用于处理包含跨页表格的文档,或选择高级模式以获得最高质量的解析。
对于某些页面交织复杂图表和图像而另一些页面只有纯文本的长文档,这可能会带来挑战:您想要最高质量的输出,但并非每个页面都需要高级解析才能实现。这正是我们新的自动模式的用武之地。
智能选择解析模式
在自动模式下,您的文档默认使用我们的标准解析模式进行解析,但您可以选择多种触发器之一,以在每页的基础上切换到我们的高级(Premium)解析模式。可用的触发器包括:
- 基于表格触发: 每当检测到类似表格的结构时
- 基于图像触发: 对包含图像的任何页面进行高级解析
- 基于文本触发: 您可以设置 LlamaParse 将搜索并据此升级解析的特定字符串,例如,您可以针对“产品详情”页面或“摘要结果”进行升级,而不是在每个表格上都触发。
- 基于正则表达式触发: 一种更高级的文本触发形式,您可以使用正则表达式作为匹配条件,从而搜索多个字符串、模式等。
自动模式优势
自动模式仅在必要页面触发,从而以较低成本获得高级模式的所有优势。这包括以下功能:
使用Mermaid 图表自动渲染图示
在我们的示例 Notebook 中,您可以看到我们将此图示转换为

这样的一个 Mermaid 图表

改进的表格读取准确性
我们的原始 PDF 包含此表格

在自动模式下被自动转换为整洁的 Markdown 格式

高级图表转换
自动模式还能够处理这组图形图表

并将其渲染为 Markdown 格式的一个易于阅读的表格

其他自动模式功能
我们的 Notebook 只是自动使用高级模式所获得功能的一部分示例,包括:
- LaTeX 公式的渲染
- 更低的幻觉率
- 更高的内容检索率
- 改进的阅读顺序
现已可用
自动模式现已可用!查看我们的示例 Notebook,深入了解如何使用它,阅读文档或前往LlamaCloud 立即注册并获取访问权限!