文章列表-AI魔法学院

文章列表

最新最全的开源中文大语言模型列表

Chinese-LLaMA-Alpaca：地址：https://github.com/ymcui/Chinese-LLaMA-Alpaca 简介：中文LLaMA

大模型

【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训

/Meta-Llama-3-8B-Instruct --local-dir-use-symlinks False --local-dir /root/model/meta-llama/Meta-Llama

Llama3 对话问答模型

大模型实践总结

Baize：白泽是在LLaMA上训练的。

大模型训练

基于Ollama本地部署Llama3指南！

模型架构 Llama 3 是一个自回归语言模型（an auto-regressive language），它使用优化的 transformer 架构。

LLama3 ollama

万字长文，AI大模型的应用实践总结

目前来看，LLaMA无疑是其中最闪亮的星。

大模型

回望做大模型一年后的感悟

首先看一下什么是所谓的LLaMA的架构，或者说这是不是一个可以固化的概念。

大模型感悟

被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线

从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最大的一个，被调侃为「庞然大物」。

Grok-1 开源模型

大模型微调经验汇总---LLM finetuning 踩坑经验之谈

开源领域 ChatGLM, LLAMA, RWKV 主要就是这3种模型，中文好一点就是 ChatGLM , 潜力最好的就是LLAMA ，RNN架构决定RWKV有很好的推理效率（随输入长度内存占比线性自增

大模型人工智能

Ollama最新更新v0.1.33，实现了多并发可同时与多个模型聊天对话！

新版本更新如下增加了多个新的LLM型号： · Llama 3：由Meta推出的新模型

ollama 语言大模型聊天

百川智能正式发布130亿参数通用大语言模型百川大模型（Baichuan-13B-Base）

Baichuan-13B 有如下几个特点: 更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿，并且在高质量的语料上训练了1.4万亿 tokens，超过 LLaMA

大模型中文

LLM微调经验&认知

延申下来，可以理解Llama（原生）是一个会听不会讲中文的人，用中文语料做指令微调，实际上更多是教他“说中文”。

LLM 大模型

12个RAG常见痛点及解决方案

Llama Guard 基于7-B Llama 2的Llama Guard可以检查输入（通过提示分类）和输出（通过响应分类）为LLMs对内容进行分类。

RAG 大模型

NEFTune：在Embedding中加入噪⾳提⾼指令微调效果！

此外，从图2中可以看出，我们还可以看到在LLaMA-1和OPT等旧模型上也有改进。

NEFTune 大语言模型

Falcon 180B 开源影响了谁？

在另一位受访者看来，Falcon似乎想要成为参数、性能、实用落地的难易程度均衡的“六边形战士”，之前的Falcon 40B的表现超过了65B的LLaMA，而且所需的显存也低于LLaMA 65B。

大模型

【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程

已经有许多优秀的仓库做过这件事情，比如：[Chinese-LLaMA-Alpaca]。

大模型训练

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1