
LlamaIndex • 2023-10-31
LlamaIndex Newsletter 2023–10–31
Llama 爱好者们,大家好 🦙!
又一周飞速过去了,我们带着最新的更新、功能、教程等等内容来了。有什么值得分享的项目、文章或视频吗?我们很乐意收录它们!请联系我们:news@llamaindex.ai。
想让这些更新直达您的收件箱?只需在我们的主页上订阅我们的时事通讯。
🤩 首先是重点:
- 文档全面更新:全面修订了文档,以便更顺畅地进行 LLM/RAG 应用开发。
- 贡献看板:我们的新看板欢迎社区驱动的 LlamaIndex 改进。
- Zephyr-7b-beta 深度分析:经过测试和验证,可在 LlamaIndex 上实现无与伦比的 ReAct 代理任务效率。
- 提升 RAG 的图像字幕功能:LLaVa 的输出现在通过基于知识的增强得到了超强提升。Notebook,Tweet
✨ 功能发布与增强
- 我们引入了检索增强图像字幕功能,通过知识库洞察增强了 LLaVa 多模态模型的输出。Notebook,Tweet。
- 我们引入了只需两行代码即可查看和设置 LlamaIndex 模块提示词的功能。文档,Tweet。
- 我们集成了
OpenAILike
类,用户可以使用与 OpenAI 兼容的 API,无论模型提供商是谁,都可以利用各种开源 LLM 项目。Tweet。 - 我们引入了 RAG 的提示词压缩功能:使用 LongLLMLingua,可将 token 使用量和延迟降低高达 20 倍。Notebook,Tweet。
- 我们引入了一种精炼 llama2 等开源 LLM 以获得结构化数据输出的方法。使用 LlamaIndex,无需 PyTorch 即可将 llama2–7b 转换为生成 Pydantic 对象。我们的指南涵盖了合成数据集创建、微调和 RAG 管道集成。Notebook,Tweet。
🎥 演示
- Harshad Suryawanshi 使用 LlamaIndex 和 Streamlit 演示了股票研究报告生成器。
- Bharat Ramanathan 构建了 Wandbot,这是一个实时 RAG 应用,支持对 Weights & Biases 文档进行聊天,并集成了 Discord 和 SlackHQ。主要功能包括周期性数据摄取、自定义文档和代码解析、模型回退以及使用 Weights and biases 进行日志记录。
🗺️ 指南
- 我们引入了全面修订的文档结构,旨在指导用户使用 LlamaIndex 从原型设计到生产 LLM/RAG 应用。深入了解我们的 200 多篇指南,提升您的应用。文档,Tweet。
- 我们在 GitHub 上这里推出了新的贡献请求看板。这是您为 LlamaIndex 做出贡献的指南,简化社区建议流程。
- 我们发布了关于如何在 LlamaIndex 中使用 Jina 8k 开源文本嵌入模型的指南。
- 我们在 LlamaIndex 中对不同能力的 llama2-chat 模型进行了全面调查。主要见解是:虽然参数越多推理能力越强,但结构化输出仍然是一个挑战。Tweet。
- 我们分享了指南,用于在 LlamaIndex RAG/代理任务上测试新发布的 HuggingFace Zephyr-7b-beta 模型,它脱颖而出,是唯一能够处理数据上的 ReAct 代理任务的 7B LLM。
- 我们分享了一个新的指南,关于 RAG 的高级提示词工程。学习理解、自定义和扩展 RAG 提示词,从 QA 模板到少样本示例和上下文/查询转换。Tweet。
✍️ 教程
- Kiran 发表了一篇博文,关于掌握 PDF:使用尖端解析器提取章节、标题、段落和表格。
- Wenqi Glantz 发表了一篇精彩的博文,关于使用 HuggingFace 的文本嵌入推理服务器和 LlamaIndex 优化文本嵌入。
- Ravi Theja 的博文深入探讨了 NVIDIA 关于 RAG 与长上下文 LLM 的研究,质疑在存在长上下文 LLM 的情况下 RAG 的必要性。
- Sudarshan Koirala 提供了一个教程,关于使用 LlamaIndex 从 .htm 页面提取表格 + 文本用于 RAG。
- Wenqi Glantz 还发表了第二篇博文,关于结合文本嵌入和 CLIP 图像嵌入进行多模态检索,用于后院鸟类识别。
⚙️ 集成与协作
- 我们与 Gradient AI 合作推出了新的 Cookbook,可以轻松微调 Llama 2 等开源 LLM 并集成到您的 LlamaIndex RAG 管道中。文档,Tweet。
- 我们集成了 HuggingFace Inference API,可访问超过 150,000 个模型。现在您可以将任何
conversational
、text_generation
、feature_extraction
端点插入您的 LlamaIndex 应用。文档,Tweet。
🎥 网络研讨会
- Mayo Oshin 和 Jerry Liu 举办了关于释放 ChatGPT 商业潜力的网络研讨会。
📚 研讨会
- Jerry Liu 和 Simon 与 Anyscale 合作举办了多部分 LlamaIndex 研讨会。
- Ravi Theja 举办了为期一天的关于使用 LlamaIndex 进行检索增强生成 (RAG) 的研讨会。