文章列表-AI魔法学院

音视频魔法

最透彻的大模型PPO原理和源码解读

详解大模型RLHF过程（配代码解读）

HAI-Chat：高效且轻量的一键式 RLHF 训练工具

用户意图对齐，无需人工标注，Zephyr-7B 超越 Llama2-Chat-70B

国内外开源大语言模型一览表

最新大模型面经+感受，4家大厂offer！

大语言模型的拐杖——RLHF基于人类反馈的强化学习

RLHF 在 Text2SQL 领域中的探索

【大模型微调】 Llama 2 ：对话模型的全过程微调

QWen1.5: 卓越模型之路

baichuan2 有什么好的深挖论文中涉及的知识点

Transformer速查宝典：模型、架构、训练方法的论文都在这里了

Deepseek-V2技术报告解读！全网最细！

更强的小型LLM：Zephyr-7B

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

<12 >