我的收藏
退出登录
全部
聊天魔法
图片魔法
写作魔法
音视频魔法
编程魔法
开源训练
最透彻的大模型
PPO
原理和源码解读
·
详解大模型RLHF过程(配代码解读)
·
HAI-Chat:高效且轻量的一键式 RLHF 训练工具
·
用户意图对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B
·
国内外开源大语言模型一览表
·
最新大模型面经+感受,4家大厂offer!
·
大语言模型的拐杖——RLHF基于人类反馈的强化学习
·
RLHF 在 Text2SQL 领域中的探索
·
【大模型微调】 Llama 2 :对话模型的全过程微调
·
QWen1.5: 卓越模型之路
·
baichuan2 有什么好的 深挖论文中涉及的知识点
·
Transformer速查宝典:模型、架构、训练方法的论文都在这里了
·
Deepseek-V2技术报告解读!全网最细!
·
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
·
更强的小型LLM:Zephyr-7B
·
<
1
2
>