文章列表-AI魔法学院

文章列表

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

与原始的 Transformer 和 Rotary 嵌入相比，它可以带来更流畅的训练和更好的下游性能。

大模型

从零开始了解AI大模型 - 概念篇：一文带你走进大模型世界

简而言之，"大模型"是具有大量参数（通常指在10亿以上）和卓越性能的Transformer结构模型，而"LLM大型语言模型"则是指针对自然语言处理的大型模型，目前在LLM人类自然语言领域取得巨大突破，主要代表为

大模型

中国首个长时长、高一致性、高动态性视频大模型，Vidu 登场

生数ShengShu ，赞6018 点击查看「Vidu」发布短片该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达

Vidu 大模型视频

如何看待大型语言模型的Prompt

自注意力是Transformer架构中最重要的单一组件。

prompt 大语言模型

“大模型+机器人”的现状和未来，重磅综述报告来了！

2、视觉Transformer模型：如ViT、Swin Transformer等，主要应用于计算机视觉任务。

论文机器人

中文原生文生图大模型来了！腾讯混元推出，Sora 同架构

升级后的腾讯混元文生图大模型采用了全新的DiT架构（DiT，即Diffusion With Transformer），这也是Sora和 Stable Diffusion 3 的同款架构和关键技术，是一种基于

文生图混元腾讯

天塌了，Scaling Law 已撞收益递减墙？OpenAI 在内，所有大模型都正遭遇巨大瓶颈

研究人员重点研究的是 transformer 模型，一类在随机生成的序列数据之上训练而成，另一类则由遵循策略生成的数据训练而成。

Scaling Law AI大模型

最新大模型面经+感受，4家大厂offer！

介绍下对transformer的了解，网络结构相比于lstm有什么不同？

大模型面试

Stable Diffusion

Meta发布业界最强文生图模型CM3Leon，实力碾压Stable Diffusion、Midjourney

本方法很简单，产生了一个强大的模型，还表明基于tokenizer的transformer可以像现有的基于生成扩散的模型一样有效地训练。

文生图

九问中国大模型掌门人，万字长文详解大模型进度趋势

问 Transformer 未来将如何演进？

大模型详解

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

本文介绍了一种名为Masked Generative Codec Transformer（MaskGCT）的全非自回归TTS模型，该模型消除了文本与语音监督之间的显式对齐需求，以及音素级持续时间预测。

MaskGCT 声音克隆

让AI记住你说的话、让AI给你生成几十万字的小说！StreamingLLM 让无限长token成为可能

，它可以让任何基于Transformer的语言模型（LLM）处理无限长度的文本，而不需要任何微调或额外的训练。

StreamingLLM 写作

视频大模型训练相关词条解释

Sora采用Diffusion Transformer (DiT)架构进行训练。

视频生成 sora 词条

重磅来袭！Llama中文社区开源预训练中文版Atom-7B大模型

| 训练过程 ⭐支持更长上下文的模型结构基于当前最优秀的开源模型 Llama2，使用主流 Decoder-only 的标准 Transformer 网络结构，支持

大模型

免训练！单图秒级别生成AI写真，人像生成进入无需训练的单阶段时代

FACT 整个框架如下图所示：为了更全面地提取人脸的细节信息，FACT 采用了在海量人脸数据上预训练的基于 Transformer 架构的人脸特征提取器

FaceChain FACT 文生图

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1