我的收藏
退出登录
全部
聊天魔法
图片魔法
写作魔法
音视频魔法
编程魔法
开源训练
详解大模型
RLHF
过程(配代码解读)
·
RLHF
在 Text2SQL 领域中的探索
·
HAI-Chat:高效且轻量的一键式
RLHF
训练工具
·
大语言模型的拐杖——
RLHF
基于人类反馈的强化学习
·
准备迎接超级人工智能系统,OpenAI宣布
RLHF
即将终结!超级对齐技术将接任
RLHF
,保证超级人工智能系统遵循人类的意志
·
最透彻的大模型PPO原理和源码解读
·
llm-action:让天下没有难学的大模型
·
【大模型微调】 Llama 2 :对话模型的全过程微调
·
来自Microsoft Build 2023:大语言模型是如何被训练出来的
·
一文讲明白什么是预训练、微调和上下文学习
·
国内外开源大语言模型一览表
·
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
·
LLM微调经验&认知
·
Transformer速查宝典:模型、架构、训练方法的论文都在这里了
·
必看!阿里通义千问完整技术报告
·
<
1
2
3
4
5
>