文章列表-AI魔法学院

音视频魔法

详解大模型RLHF过程（配代码解读）

大语言模型的拐杖——RLHF基于人类反馈的强化学习

HAI-Chat：高效且轻量的一键式 RLHF 训练工具

深度好文，Agent盛行前传

清华&面壁开源新一代主动Agent交互范式！让AI从被命令到主动帮助

【大模型微调】 Llama 2 ：对话模型的全过程微调

活久见，世界上第一个被人类骗走钱的AI，刚刚出现了！

baichuan2 有什么好的深挖论文中涉及的知识点

大模型与游戏结合的一个思路

来自Microsoft Build 2023：大语言模型是如何被训练出来的

更强的小型LLM：Zephyr-7B

最透彻的大模型PPO原理和源码解读

一个产品经理的大模型观察、反思与预测

必看！阿里通义千问完整技术报告

清华、面壁智能发布：主动式Agent 2.0

<12 3 4 5 6 7 >