首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 大模型业务应用中数据准备的要求、难点及解决思路
· 一文搞定 ComfyUI SDXL1.0 完整流程
· Prompt小技巧(18):万能Prompt
· 比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 大模型狂飙两年后,“六小龙”开始做减法
· Examful.ai
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· AI音乐热潮下,“神曲工作室”率先失业
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
深度洞察:人工智能体(AI Agent)2024年重要发展趋势指南
自我改进的AI智能体:有多种方法可以改进LLM响应-少量提示、微调、RAG、
RLHF
-但这些改进通常需要手动实施组件。
AI
Agent
人工智能
「长文」可能是目前最全的LangChain AI资源库之一
a69d2a5e9cfae3676a6d3a0f9a1e4c850c0d3e7654dddf343c6e86280db279c0/687 代理商 •CollosalAI Chat[61]: 使用
RLHF
工作
大模型
如何构建基于大模型的App
nbsp; 文本嵌入模型用于语义搜索和生成向量嵌入 · · 微调模型以在特定任务上获得更好的性能 · · 指令微调模型可以充当的助手,例如
RLHF
构建
大模型App
人工智能
AI产品经理视角:如何构建人工智能产品
该技术也称为人类反馈强化学习 (
RLHF
)。
大模型
产品经理
语义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索
· 核心竞争力 ChatGPT受到关注的重要原因是引入新技术**
RLHF
(Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)。
开源模型
开源
最新最全的开源中文大语言模型列表
hiyouga/LLaMA-Efficient-Tuning 简介:该项目提供了易于使用的基于PEFT的LLaMA微调框架,实现了包括全参数,LoRA,QLoRA等的预训练,指令微调和
RLHF
大模型
大模型
九问中国大模型掌门人,万字长文详解大模型进度趋势
目前大家已经在推进很多模型对齐技术的工作,包括通过
RLHF
这些方法,如果这部分技术想寻求突破,有两点很重要。
大模型
详解
Agent
AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
目前强化学习还只在 LLM 的
RLHF
阶段出现,在 agent 领域引入 RL 的思想可能能帮助 AI Agent 有进一步的突破。
大模型
AI编程
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
在大语言模型的研究领域里,结合了强化学习和直接人类反馈的“以人类反馈为导向的强化学习”(
RLHF
)方法 [127, 128] 已被广泛采用来实现模型对齐。
sora
论文
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
在大语言模型的研究领域里,结合了强化学习和直接人类反馈的“以人类反馈为导向的强化学习”(
RLHF
)方法 [127, 128] 已被广泛采用来实现模型对齐。
Sora
微软
<
1
2
3
4
5
>
1
2
4
5
6
7
8
9
100