首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 硬核解读Stable Diffusion(系列三)
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 使用python调用comfyui-api,实现出图自由
· stable diffusion如何确保每张图的面部一致?
· 教会AI画汉字(ComfyUI篇)
· 最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 11个顶级的Prompts,用GPT学习的天花板
· Prompt工程入门
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
省钱!微软开源框架LLMLingua +
LlamaIndex
实现提示词压缩
更多技术细节和理论研究请参考LLMLingua的官方网站和论文: https://github.com/microsoft/LLMLingua 今天我们来看看在具体的应用场景中,如何使用LlmLingua与
LlamaIndex
LLMLingua
LlamaIndex
开源框架
RAG
LlamaIndex
的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
在前面文章《应用编排的未来是Pipeline,
LlamaIndex
开发预览版推出Query Pipeline,提升应用开发的灵活性》里,我们提到了
llamaindex
出了一个新的实验feature,支持通过声明式的方式定义
Agent
QueryPipeline
大模型
如何避免大语言模型绕过知识库乱答的情况?
LlamaIndex
原理与应用简介
本文译自
LlamaIndex
: How to Use Index Correctly[1],翻译内容并非原版无对照翻译,有所增减。
大语言模型
应用编排的未来是Pipeline,
LlamaIndex
开发预览版推出Query Pipeline,提升应用开发的灵活性
在这里不论是langchain选择了命令式的langchain template,还是今天要介绍的主角
llamaindex
选择的声明式的QueryPipeline,以及在此之前已经发布了数据处理阶段的pipeline
Query
Pipeline
大模型
RAG
RAG应用中数据处理过程需要注意的事项
随着检索增强生成(RAG)应用程序不断发展,这些应用程序通常将Langchain/
LlamaIndex
与Weaviate/Pinecone和foundation Models结合在一起,它们遇到了各种障碍
RAG
大模型
大模型
PostgreSQL的三位一体——在大模型应用中结合关系型、向量和时间序列数据
结合
LlamaIndex
使用Timescale Vector 以下结合
LlamaIndex
实操的内容摘自
LlamaIndex
创始人Jeff Liu的blog。
大模型
PostgreSQL
RAG
RAG超参数调优食用指南
为了解决这些问题
LlamaIndex
推出了一个 ParamTuner 类,可以自动、高效地执行超参数调整。
rag
大模型
Prompt
Prompt 策略:代码库 AI 助手的语义化搜索设计
在设计时,为了更好的在框架底层提供这种能力,我们参阅了 Bloop 应用、LangChain、Spring AI、
LlamaIndex
框架等的代码与思想,参考/复制(基于 Apache
prompt
RAG
LLMOps框架Dify发布Workflow功能,RAG进入自由编排时代(附产品负责人分享PPT )
不能用模型的用流程,甚至采用“Human in Loop”的方式,将整个工作流程白盒化,把大模型能力限制在封闭的问题内,让大模型更可控,提升整个应用的可解释性和鲁棒性,这样的思路也成为了业内共识,Langchain,
llamaindex
RAG
自由编排
Workflow
RAG
12个RAG常见痛点及解决方案
LlamaIndex
提供了一个关于调优开源嵌入模型的分步指南,证明了调优嵌入模型可以在整个eval度量套件中一致地提高度量。
RAG
大模型
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
llamaindex
实现下的RAG架构 以RAG召回为例,最原始的做法是通过top-k的方式从向量数据库中检索背景数据然后直接提交给LLM去生成答案,但这样存在检索出来的chunks并不一定完全和上下文相关的问题
大模型
开源
开源新标杆,千问Qwen2系列模型发布,全面超越LLama3
、SGL、SkyPilot、TensorRT-LLM、OpenVino、TGI) 本地运行(MLX、Llama.cpp、Ollama、LM Studio) Agent及RAG(检索增强生成)框架(
LlamaIndex
qwen
千问
开源
RAG
高级 RAG 技术——图解概览
要深入了解,可以查看
LlamaIndex
关于递归检索器和节点引用的教程。
RAG
检索
图解
RAG
图解检索增强式生成(RAG)技术 | 万字长文
LlamaIndex
采用了类似的方法实现这一功能。
检索增强式生成
RAG
数据库
点评:六大向量数据库
AI研究院利用自主开发的MAP-GPT:源码-架构图智能生成系统,独家发布 六大热门向量数据库的模块库架构图,包括: Milvus、Zilliz、Faiss、Qdrant、
LlamaIndex
和Chroma
向量数据库
<
1
2
3
>
1
2
4
5
6
7
8
9
100