首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型
训
练
工
程
那些事
曼哈顿
工
程
并不仅仅是一项科技挑战,它是一个集科技、人力、资源和时间于一体的复杂系统
工
程
。
训练工程
大模型
Prompt
Prompt
工
程
如此强大,我们还需要模型
训
练
吗?
3.如果我们还需要模型
训
练
,例如在GPT3基础上把21年以后的数据喂进去,其中学到的新信息与
大模型
LLM
个人从零预
训
练
1B LLM心路历
程
其实在当时就有不少些这种“从零预
训
练
LLM”的开源项目了,但是大多
训
练
的数据量或者是模型都很小(几块4090+几十G数据就能跑起来),并没有暴露出一些
工
程
上的问题,
训
练
细节也没有分享的特别清晰。
LLM
训练
HAI-Chat:高效且轻量的一键式 RLHF
训
练
工
具
对话式人
工
智能
工
具的流行引发了人们对人
工
智能安全的担忧。
HAI-Chat
RLHF
大模型
领域大模型LLM
训
练
Trick
答:通过分析发现现有的开源大模型进行预
训
练
的过
程
中会加入书籍、论文等数据。
垂直
训练
大模型
大模型
领域大模型-
训
练
Trick&落地思考
现有大模型在预
训
练
过
程
中都会加入书籍、论文等数据,那么在领域预
训
练
时这两种数据其实也是必不可少的,主要是因为这些数据的数据质量较高、领域强相关、知识覆盖率(密度)大,可以让模型更适应考试。
垂直
训练
大模型
人
工
智能
训
练
的灾难性遗忘以及解决方案
例如,一些研究人员正在尝试通过改进模型的结构和
训
练
方法来缓解灾难性遗忘问题,而另一些研究人员则试图通过结合深度学习和生物神经网络的方法,来构建更接近生物神经网络的人
工
神经网络。
人工智能
大模型
如何使用 Megatron-LM
训
练
语言模型
在 PyTorch 中
训
练
大语言模型不仅仅是写一个
训
练
循环这么简单。
开源模型
免
训
练
!单图秒级别生成AI写真,人像生成进入无需
训
练
的单阶段时代
这一创新版本摒弃了传统的人物模型
训
练
过
程
,能够直接生成 zero-shot 目标人像,引领 AI 人像生成进入了无需
训
练
的单阶段时代。
FaceChain
FACT
文生图
ChatGLM
使用自己的数据
训
练
清华ChatGLM2-6B 模型
o o • dev.json文件也是一样的格式,但是它是用于验证的,会在
训
练
过
程
中用于评估模型在这部分数据上的表现。
ChatGLM2-6B
大模型
大模型
训
练
为什么用A100不用4090
看算力和内存也能看出来,H100 的 FP16 算力大约是 4090 的 6 倍,内存带宽是 3.35 倍,
训
练
过
程
中由于 batch size 比较大,大多数算子是 compute bound(计算密集型
大模型
大模型
视频大模型
训
练
相关词条解释
OpenAI在22年发布的ChatGPT改变了语言人
工
智能格局,24年发布的Sora目测也在改变着视频人
工
智能格局。
视频生成
sora
词条
大模型
微调百川Baichuan-13B保姆式教
程
,手把手教你
训
练
百亿大模型
本文是一个Step By Step的大模型
训
练
教
程
,即使你是
训
练
大模型的新手,通过本教
程
,也可以快速在一张显卡上
训
练
自己的大模型。
大模型
微调
LLM
【一步一步引导】从零详细地梳理一个完整的 LLM
训
练
流
程
1.预
训
练
阶段(Pretraining Stage)
工
欲善其事,必先利其器。
大模型
训练
大规模
训
练
系列之技术挑战
0 前言 本次分享是大规模
训
练
技术系列的第一篇,主要包括两个部分: · 大规模
训
练
技术的意义 · 大规模
训
练
的技术挑战 1 大规模
训
练
技术的意义 1.1
训
练
的精度极限
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100