文章列表-AI魔法学院

文章列表

Stable Diffusion

硬核解读Stable Diffusion（系列一）

这里将基于Hugging Face的diffusers库深入讲解SD的技术原理以及部分的实现细节，然后也会介绍SD的常用功能，注意本文主要以SD V1.5版本为例，在最后也会简单介绍 SD 2.0版本以及基于

StableDiffusion 文生图

【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程

我们通常需要在训练语料中加入一些领域数据（如：[xuanyuan 2.0]），以帮助模型在指定领域内获得更好的效果。

大模型训练

Stable Diffusion

Stable Diffusion 加速/优化/升级优化出图速度

3.09 it/s，出图时间 = 14s Pytorch2.1+CUDA118（-opt-sdp），运行最高峰值可达 5.28 it/s，出图时间 = 11s 1.升级PyTorch 2.0

Stable Diffusion 文生图

京沪“中国大模型第一城”争夺战爆发｜钛媒体·封面

创新工场创始人兼CEO，零一万物CEO李开复博士在2023中关村论坛上对钛媒体App等表示，北京是在AI大模型和AI 2.0层面政策帮扶力度最大的城市之一，政策中包括对人才的帮助、算力的帮助都是特别重要的内容

大模型钛媒体

Stable Diffusion

全网最全AI绘画Stable Diffusion关键技术解析

· Stable Diffusion 2.x系列: SD 2.0：基于CompVis模型，提升细节生成能力

Stable Diffusion 文生图

AI进化的新纪元：AI AIgents时代（1/9）——什么是Agent？

LearnPrompt.pro 2.0 更新Agent模块！

大模型

深度洞察：人工智能体(AI Agent)2024年重要发展趋势指南

智能设备将走向智能2.0。

AI Agent 人工智能

清华系17人，撑起中国大模型创业半壁江山

随后，2020年10月，智源研究院率先确定了大模型研究战略方向，时任智源副院长的唐杰带领团队在2021年发布了悟道1.0和2.0模型。

大模型

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

具体来说，使用W2v-BERT 2.0模型的第17层隐藏状态作为语音编码器的语义特征，编码器和解码器由多个ConvNext块组成。

MaskGCT 声音克隆

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

但是值得注意的是，相比其他的开源模型基本上是基于Apache 2.0的授权协议，可以支持商用。

小语言模型

国产AI，逃过一劫

nbsp;当年3月发布的GPT-4，并称其实现了基础模型的全面升级，在理解、生成、逻辑和记忆能力上都有显著提升，综合能力“与GPT-4相比毫不逊色”；同月，阿里方面也在云栖大会上发布千亿级参数大模型通义千问2.0

ChatGPT 大模型

Stable Diffusion

硬核解读Stable Diffusion（系列二）

ensp; image = torch.from_numpy(image) return 2.0&

StableDiffusion 文生图

无限逼近真人效果的“超真实人像大模型”，或许它才是你一直在寻找的真爱！

隐结构扩散模型的关键信息如下所示： o 利用SD-2.0作为基础的预训练模型； o 利用OpenCLIP作为对应的文本编码器；

大模型文生图

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

零一万物等国内头部顶尖人工智能团队通力合作的第一个支持中英双语、语音到文本的多模态开源对话模型 (LLaSM) 第一个基于 Llama 2 的支持中英文双语视觉到文本的多模态模型 (Chinese-LLaVA) 两个模型都基于 Apache-2.0

开源模型

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

具体而言，它在librispeech测试集的test-clean和test-other数据集上分别实现了2.0%和4.2%的词错误率（WER）。

大模型语音

<1 2 3 456 7 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1