我的收藏
退出登录
全部
聊天魔法
图片魔法
写作魔法
音视频魔法
编程魔法
开源训练
详解大模型RLHF过程(配代码解读)
·
大语言模型的拐杖——RLHF基于人类反馈的强化学习
·
HAI-Chat:高效且轻量的一键式 RLHF 训练工具
·
深度好文,Agent盛行前传
·
【大模型微调】 Llama 2 :对话模型的全过程微调
·
活久见,世界上第一个被人类骗走钱的AI,刚刚出现了!
·
大模型与游戏结合的一个思路
·
baichuan2 有什么好的 深挖论文中涉及的知识点
·
最透彻的大模型PPO原理和源码解读
·
来自Microsoft Build 2023:大语言模型是如何被训练出来的
·
更强的小型LLM:Zephyr-7B
·
谁杀死了我们的技术教程?网络技术教程越来越少?
·
清华、面壁智能发布:主动式Agent 2.0
·
一个产品经理的大模型观察、反思与预测
·
必看!阿里通义千问完整技术报告
·
<
1
2
3
4
5
6
>