首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion | 常见问题清点汇总
· Coze多智能体(Multi-Agents)模式体验!
· 微软、OpenAI大佬暗示LLM应用开发范式迁移:从Prompt Engineering到Flow Engineering
· Fooocus更新了2.3
· 震撼科技界:清华大学与智谱AI联手,引领中文长文智能写作新纪元!
· Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· 今天分享一个官方的高级的做数据分析的prompt提示词
· Suno音乐新手指南(手把手完整版教程)
· 接私活必看的11个开源项目
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
硬核解读Stable Diffusion(系列一)
这里将基于Hugging Face的diffusers库深入讲解SD的技术原理以及部分的实现细节,然后也会介绍SD的常用功能,注意本文主要以SD V1.5版本为例,在最后也会简单介绍 SD
2.0
版本以及基于
StableDiffusion
文生图
LLM
【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程
我们通常需要在训练语料中加入一些领域数据(如:[xuanyuan
2.0
]),以帮助模型在指定领域内获得更好的效果。
大模型
训练
Stable Diffusion
Stable Diffusion 加速/优化/升级 优化出图速度
3.09 it/s,出图时间 = 14s Pytorch2.1+CUDA118(-opt-sdp),运行最高峰值可达 5.28 it/s,出图时间 = 11s 1.升级PyTorch
2.0
Stable
Diffusion
文生图
大模型
京沪“中国大模型第一城”争夺战爆发|钛媒体·封面
创新工场创始人兼CEO,零一万物CEO李开复博士在2023中关村论坛上对钛媒体App等表示,北京是在AI大模型和AI
2.0
层面政策帮扶力度最大的城市之一,政策中包括对人才的帮助、算力的帮助都是特别重要的内容
大模型
钛媒体
Stable Diffusion
全网最全AI绘画Stable Diffusion关键技术解析
· Stable Diffusion 2.x系列: SD
2.0
:基于CompVis模型,提升细节生成能力
Stable
Diffusion
文生图
Agent
AI进化的新纪元:AI AIgents时代(1/9)——什么是Agent?
LearnPrompt.pro
2.0
更新Agent模块!
大模型
人工智能
深度洞察:人工智能体(AI Agent)2024年重要发展趋势指南
智能设备将走向智能
2.0
。
AI
Agent
人工智能
大模型
清华系17人,撑起中国大模型创业半壁江山
随后,2020年10月,智源研究院率先确定了大模型研究战略方向,时任智源副院长的唐杰带领团队在2021年发布了悟道1.0和
2.0
模型。
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
具体来说,使用W2v-BERT
2.0
模型的第17层隐藏状态作为语音编码器的语义特征,编码器和解码器由多个ConvNext块组成。
MaskGCT
声音克隆
微软
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
但是值得注意的是,相比其他的开源模型基本上是基于Apache
2.0
的授权协议,可以支持商用。
小语言模型
国产AI,逃过一劫
nbsp;当年3月发布的GPT-4,并称其实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有显著提升,综合能力“与GPT-4相比毫不逊色”;同月,阿里方面也在云栖大会上发布千亿级参数大模型通义千问
2.0
ChatGPT
大模型
Stable Diffusion
硬核解读Stable Diffusion(系列二)
ensp; image = torch.from_numpy(image) return
2.0
&
StableDiffusion
文生图
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
隐结构扩散模型的关键信息如下所示: o 利用SD-
2.0
作为基础的预训练模型; o 利用OpenCLIP作为对应的文本编码器;
大模型
文生图
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
零一万物等国内头部顶尖人工智能团队通力合作的第一个支持中英双语、语音到文本的多模态开源对话模型 (LLaSM) 第一个基于 Llama 2 的支持中英文双语视觉到文本的多模态模型 (Chinese-LLaVA) 两个模型都基于 Apache-
2.0
开源模型
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
具体而言,它在librispeech测试集的test-clean和test-other数据集上分别实现了
2.0
%和4.2%的词错误率(WER)。
大模型
语音
<
1
2
3
4
5
6
7
>
1
2
4
5
6
7
8
9
100