文章列表-AI魔法学院

音视频魔法

详解大模型RLHF过程（配代码解读）

RLHF 在 Text2SQL 领域中的探索

HAI-Chat：高效且轻量的一键式 RLHF 训练工具

大语言模型的拐杖——RLHF基于人类反馈的强化学习

准备迎接超级人工智能系统，OpenAI宣布RLHF即将终结！超级对齐技术将接任RLHF，保证超级人工智能系统遵循人类的意志

最透彻的大模型PPO原理和源码解读

llm-action：让天下没有难学的大模型

【大模型微调】 Llama 2 ：对话模型的全过程微调

来自Microsoft Build 2023：大语言模型是如何被训练出来的

活久见，世界上第一个被人类骗走钱的AI，刚刚出现了！

国内外开源大语言模型一览表

一文讲明白什么是预训练、微调和上下文学习

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

Transformer速查宝典：模型、架构、训练方法的论文都在这里了

LLM微调经验&认知

<12 3 4 5 >