首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ComfyUI安装及生成第一张图
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Stable Diffusion | 常见问题清点汇总
· RVC和SVC声音模型难找?推荐这个网站
· ComfyUI的特性以及安装流程
· 大模型应用中大部分人真正需要去关心的核心——Embedding
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
省钱!微软开源框架LLMLingua +
LlamaIndex
实现提示词压缩
更多技术细节和理论研究请参考LLMLingua的官方网站和论文: https://github.com/microsoft/LLMLingua 今天我们来看看在具体的应用场景中,如何使用LlmLingua与
LlamaIndex
LLMLingua
LlamaIndex
开源框架
RAG
LlamaIndex
的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
在前面文章《应用编排的未来是Pipeline,
LlamaIndex
开发预览版推出Query Pipeline,提升应用开发的灵活性》里,我们提到了
llamaindex
出了一个新的实验feature,支持通过声明式的方式定义
Agent
QueryPipeline
大模型
如何避免大语言模型绕过知识库乱答的情况?
LlamaIndex
原理与应用简介
本文译自
LlamaIndex
: How to Use Index Correctly[1],翻译内容并非原版无对照翻译,有所增减。
大语言模型
应用编排的未来是Pipeline,
LlamaIndex
开发预览版推出Query Pipeline,提升应用开发的灵活性
在这里不论是langchain选择了命令式的langchain template,还是今天要介绍的主角
llamaindex
选择的声明式的QueryPipeline,以及在此之前已经发布了数据处理阶段的pipeline
Query
Pipeline
大模型
RAG
RAG应用中数据处理过程需要注意的事项
随着检索增强生成(RAG)应用程序不断发展,这些应用程序通常将Langchain/
LlamaIndex
与Weaviate/Pinecone和foundation Models结合在一起,它们遇到了各种障碍
RAG
大模型
大模型
PostgreSQL的三位一体——在大模型应用中结合关系型、向量和时间序列数据
结合
LlamaIndex
使用Timescale Vector 以下结合
LlamaIndex
实操的内容摘自
LlamaIndex
创始人Jeff Liu的blog。
大模型
PostgreSQL
RAG
RAG超参数调优食用指南
为了解决这些问题
LlamaIndex
推出了一个 ParamTuner 类,可以自动、高效地执行超参数调整。
rag
大模型
Prompt
Prompt 策略:代码库 AI 助手的语义化搜索设计
在设计时,为了更好的在框架底层提供这种能力,我们参阅了 Bloop 应用、LangChain、Spring AI、
LlamaIndex
框架等的代码与思想,参考/复制(基于 Apache
prompt
RAG
LLMOps框架Dify发布Workflow功能,RAG进入自由编排时代(附产品负责人分享PPT )
不能用模型的用流程,甚至采用“Human in Loop”的方式,将整个工作流程白盒化,把大模型能力限制在封闭的问题内,让大模型更可控,提升整个应用的可解释性和鲁棒性,这样的思路也成为了业内共识,Langchain,
llamaindex
RAG
自由编排
Workflow
RAG
12个RAG常见痛点及解决方案
LlamaIndex
提供了一个关于调优开源嵌入模型的分步指南,证明了调优嵌入模型可以在整个eval度量套件中一致地提高度量。
RAG
大模型
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
llamaindex
实现下的RAG架构 以RAG召回为例,最原始的做法是通过top-k的方式从向量数据库中检索背景数据然后直接提交给LLM去生成答案,但这样存在检索出来的chunks并不一定完全和上下文相关的问题
大模型
开源
开源新标杆,千问Qwen2系列模型发布,全面超越LLama3
、SGL、SkyPilot、TensorRT-LLM、OpenVino、TGI) 本地运行(MLX、Llama.cpp、Ollama、LM Studio) Agent及RAG(检索增强生成)框架(
LlamaIndex
qwen
千问
开源
RAG
高级 RAG 技术——图解概览
要深入了解,可以查看
LlamaIndex
关于递归检索器和节点引用的教程。
RAG
检索
图解
RAG
图解检索增强式生成(RAG)技术 | 万字长文
LlamaIndex
采用了类似的方法实现这一功能。
检索增强式生成
RAG
数据库
点评:六大向量数据库
AI研究院利用自主开发的MAP-GPT:源码-架构图智能生成系统,独家发布 六大热门向量数据库的模块库架构图,包括: Milvus、Zilliz、Faiss、Qdrant、
LlamaIndex
和Chroma
向量数据库
<
1
2
3
>
1
2
4
5
6
7
8
9
100