宣布我们的 LlamaCloud 正式发布(以及我们的 1900 万美元 A 轮融资)!
LlamaIndex

LlamaIndex 2023-10-31

LlamaIndex Newsletter 2023–10–31

Llama 爱好者们,大家好 🦙!

又一周飞速过去了,我们带着最新的更新、功能、教程等等内容来了。有什么值得分享的项目、文章或视频吗?我们很乐意收录它们!请联系我们:news@llamaindex.ai

想让这些更新直达您的收件箱?只需在我们的主页上订阅我们的时事通讯。

🤩 首先是重点:

  1. 文档全面更新:全面修订了文档,以便更顺畅地进行 LLM/RAG 应用开发。
  2. 贡献看板:我们的新看板欢迎社区驱动的 LlamaIndex 改进。
  3. Zephyr-7b-beta 深度分析:经过测试和验证,可在 LlamaIndex 上实现无与伦比的 ReAct 代理任务效率。
  4. 提升 RAG 的图像字幕功能:LLaVa 的输出现在通过基于知识的增强得到了超强提升。NotebookTweet

✨ 功能发布与增强

  • 我们引入了检索增强图像字幕功能,通过知识库洞察增强了 LLaVa 多模态模型的输出。NotebookTweet
  • 我们引入了只需两行代码即可查看和设置 LlamaIndex 模块提示词的功能。文档Tweet
  • 我们集成了 OpenAILike 类,用户可以使用与 OpenAI 兼容的 API,无论模型提供商是谁,都可以利用各种开源 LLM 项目。Tweet
  • 我们引入了 RAG 的提示词压缩功能:使用 LongLLMLingua,可将 token 使用量和延迟降低高达 20 倍。NotebookTweet
  • 我们引入了一种精炼 llama2 等开源 LLM 以获得结构化数据输出的方法。使用 LlamaIndex,无需 PyTorch 即可将 llama2–7b 转换为生成 Pydantic 对象。我们的指南涵盖了合成数据集创建、微调和 RAG 管道集成。NotebookTweet

🎥 演示

  • Harshad Suryawanshi 使用 LlamaIndex 和 Streamlit 演示了股票研究报告生成器。
  • Bharat Ramanathan 构建了 Wandbot,这是一个实时 RAG 应用,支持对 Weights & Biases 文档进行聊天,并集成了 Discord 和 SlackHQ。主要功能包括周期性数据摄取、自定义文档和代码解析、模型回退以及使用 Weights and biases 进行日志记录。

🗺️ 指南

  • 我们引入了全面修订的文档结构,旨在指导用户使用 LlamaIndex 从原型设计到生产 LLM/RAG 应用。深入了解我们的 200 多篇指南,提升您的应用。文档Tweet
  • 我们在 GitHub 上这里推出了新的贡献请求看板。这是您为 LlamaIndex 做出贡献的指南,简化社区建议流程。
  • 我们发布了关于如何在 LlamaIndex 中使用 Jina 8k 开源文本嵌入模型的指南
  • 我们在 LlamaIndex 中对不同能力的 llama2-chat 模型进行了全面调查。主要见解是:虽然参数越多推理能力越强,但结构化输出仍然是一个挑战。Tweet
  • 我们分享了指南,用于在 LlamaIndex RAG/代理任务上测试新发布的 HuggingFace Zephyr-7b-beta 模型,它脱颖而出,是唯一能够处理数据上的 ReAct 代理任务的 7B LLM。
  • 我们分享了一个新的指南,关于 RAG 的高级提示词工程。学习理解、自定义和扩展 RAG 提示词,从 QA 模板到少样本示例和上下文/查询转换。Tweet

✍️ 教程

  • Kiran 发表了一篇博文,关于掌握 PDF:使用尖端解析器提取章节、标题、段落和表格。
  • Wenqi Glantz 发表了一篇精彩的博文,关于使用 HuggingFace 的文本嵌入推理服务器和 LlamaIndex 优化文本嵌入。
  • Ravi Theja博文深入探讨了 NVIDIA 关于 RAG 与长上下文 LLM 的研究,质疑在存在长上下文 LLM 的情况下 RAG 的必要性。
  • Sudarshan Koirala 提供了一个教程,关于使用 LlamaIndex 从 .htm 页面提取表格 + 文本用于 RAG。
  • Wenqi Glantz 还发表了第二篇博文,关于结合文本嵌入和 CLIP 图像嵌入进行多模态检索,用于后院鸟类识别。

⚙️ 集成与协作

  • 我们与 Gradient AI 合作推出了新的 Cookbook,可以轻松微调 Llama 2 等开源 LLM 并集成到您的 LlamaIndex RAG 管道中。文档Tweet
  • 我们集成了 HuggingFace Inference API,可访问超过 150,000 个模型。现在您可以将任何 conversationaltext_generationfeature_extraction 端点插入您的 LlamaIndex 应用。文档Tweet

🎥 网络研讨会

📚 研讨会

  • Jerry Liu 和 Simon 与 Anyscale 合作举办了多部分 LlamaIndex 研讨会。
  • Ravi Theja 举办了为期一天的关于使用 LlamaIndex 进行检索增强生成 (RAG) 的研讨会