我的收藏
退出登录
全部
聊天魔法
图片魔法
写作魔法
音视频魔法
编程魔法
开源训练
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
·
新测试基准发布,最强开源Llama 3尴尬了
·
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
·
2023年LLM如何入门?请看这篇综述!
·
人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法
·
微软Phi-3、Mixtral 8x22B等小模型过拟合,三分之二存在数据污染
·
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
·
总结!大模型微调(Tuning)的常见方法
·
开源新标杆,千问Qwen2系列模型发布,全面超越LLama3
·
微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
·
发现一个好东西,一键本地运行各种大模型!包括最新的Qwen1.5
·
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
·
大模型推理能力增强方法总结
·
9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
·
国内外开源大语言模型一览表
·
<
1
2
3
4
>