首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
最新最全的开源中文大语言模型列表
hiyouga/LLaMA-Efficient-Tuning 简介:该项目提供了易于使用的基于PEFT的LLaMA微调框架,实现了包括全参数,LoRA,QLoRA等的预训练,指令微调和
RLHF
大模型
大模型
九问中国大模型掌门人,万字长文详解大模型进度趋势
目前大家已经在推进很多模型对齐技术的工作,包括通过
RLHF
这些方法,如果这部分技术想寻求突破,有两点很重要。
大模型
详解
Agent
AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
目前强化学习还只在 LLM 的
RLHF
阶段出现,在 agent 领域引入 RL 的思想可能能帮助 AI Agent 有进一步的突破。
大模型
AI编程
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
在大语言模型的研究领域里,结合了强化学习和直接人类反馈的“以人类反馈为导向的强化学习”(
RLHF
)方法 [127, 128] 已被广泛采用来实现模型对齐。
Sora
微软
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
在大语言模型的研究领域里,结合了强化学习和直接人类反馈的“以人类反馈为导向的强化学习”(
RLHF
)方法 [127, 128] 已被广泛采用来实现模型对齐。
sora
论文
<
1
2
3
4
5
>
1
2
4
5
6
7
8
9
100