宣布我们的LlamaCloud正式发布(以及我们价值1900万美元的A轮融资)!
LlamaIndex

LlamaIndex 2024-07-09

LlamaCloud - 专为企业级LLM应用构建者打造

RAG的好坏取决于您的数据

构建生产就绪的LLM应用很困难。我们与数百名用户进行了交流,从财富500强企业到种子轮前初创公司,他们告诉我们他们面临的挑战如下

  • 数据质量问题:大多数公司处理大量复杂、异构的文档。例如格式混乱的PDF文件、图像、跨多页的表格、不同的语言等等。确保高质量的数据输入至关重要。“垃圾输入,垃圾输出”对于LLM应用尤其适用。
  • 可伸缩性障碍:每个新的数据源都需要大量的工程时间来进行自定义解析和调优。保持数据源同步也不容易。
  • 准确性问题:当LLM与企业数据交互时,不良的检索和幻觉是常见问题,导致输出不可靠。
  • 配置负担过重:微调LLM应用涉及大量参数,通常需要深厚的技术专长,使得迭代改进成为一项艰巨的任务。

随着开发者从原型转向构建生产应用,需要复杂的编排,他们希望集中管理数据抽象。他们希望拥有一个统一的界面来处理和检索来自不同数据源的数据。

为了解决这些困难,我们在几个月前软启动了LlamaCloud并广泛提供了LlamaParse,为您的LLM和RAG应用带来生产级的上下文增强。LlamaParse已支持50多种语言和100多种文档格式。其普及度令人惊叹——LlamaParse的活跃用户已达数万,处理了数千万页文档!以下是Carlyle应用AI负责人Dean Barr的评价示例

作为一名获得了美国首批机器学习专利之一、并在全球最大的私募股权基金之一构建尖端AI能力的应用AI数据科学家,我可以自信地说,LlamaIndex的LlamaParse是我目前见过的用于解析企业级RAG管道中复杂文档结构的最佳技术。它保留嵌套表格、提取复杂空间布局和图像的能力,是高级RAG和代理模型构建中维护数据完整性的关键。

中心化知识管理的兴起

我们将LlamaCloud设计为满足您的LLM和RAG应用对 生产级 上下文增强 的需求。让我们看看LlamaCloud带来了什么

  1. LlamaParse:我们最先进的解析器,将包含表格和图表的复杂文档转换为LLM友好格式。您可以在此处了解更多关于LlamaParse的信息。
  2. 托管式数据摄取:轻松连接到企业数据源和您选择的数据存储。我们支持多种数据源,并正在增加更多支持。LlamaCloud提供了用于生成向量嵌入的默认解析配置,同时也允许针对特定应用进行深度定制。
  3. 高级检索:LlamaCloud支持基础的语义搜索检索,以及混合搜索、重排和元数据过滤等高级技术,以提高检索的准确性。这为在复杂文档上构建端到端RAG提供了必要的配置能力。
  4. LlamaCloud Playground:一个交互式用户界面,用于在部署前测试和优化您的数据摄取和检索策略。
  5. 可伸缩性和安全性:处理大量生产数据。根据您的安全需求,提供合规认证和部署选项。

这段视频详细演示了LlamaCloud

我们的客户告诉我们,LlamaCloud使开发者能够减少为LLM用例设置和迭代数据管道的时间,从而更快地完成LLM应用开发生命周期。以下是Scaleport.ai首席技术官Teemu Lahdenpera的评价

LlamaCloud确实加快了我们的开发周期。快速实现技术原型使我们能够立即展示实际价值,从而改善我们的销售成果。需要时,从LlamaCloud UI切换到代码非常顺畅。可配置的解析和检索功能显著提高了我们的响应准确性。
我们还在LlamaParse上看到了很好的结果,发现它在某些OCR任务上优于GPT-4 Vision!

亲自尝试

我们已开放LlamaCloud的官方候补名单。以下是参与方式

  1. 加入LlamaCloud候补名单在此注册
  2. 联系我们:有问题?想讨论无限商业用途?联系我们,我们聊聊!注意:我们为部分企业支持私有部署
  3. 保持更新:在Twitter上关注我们,并加入我们的Discord社区,及时获取最新信息。

同时,任何人都可以通过https://cloud.llamaindex.ai/创建账户。在等待官方LlamaCloud访问权限期间,您可以立即开始使用我们的LlamaParse API。

我们在接下来的几周内将发布大量新功能。我们期待看到您在LlamaCloud之上构建的上下文增强型LLM应用!🚀🦙

常见问题

有关于如何使用LlamaCloud的示例吗?

当然有!LlamaCloud的一个强大之处在于其端点可以轻松集成到您现有的代码中。我们的llamacloud-demo仓库提供了许多示例,从入门运行评估都有。

这与向量数据库有竞争关系吗?

不。LlamaCloud主要专注于数据解析和摄取,这与任何向量存储提供商是互补层。检索层是在现有存储系统之上的编排。LlamaIndex开源版本集成了40多个最流行的向量数据库,我们正在根据客户需求将LlamaCloud与存储提供商集成。