首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 小白也可以一键安装的Stable Diffusion——Easy Diffusion
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 阿里Outfit Anyone实现真人百变换装
· 阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
· 我去华强北走了一圈,发现这里正被另一种 AI 包围
· AI绘画由入门到精通:StableDiffusion精讲课程
· 让你不怕任何事的3个顶级思维(建议收藏)
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 真超越了GPT?国产大模型实用场景横评②
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换成
语
音
的AI工具。
TTS
文本转语音
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
它主要通过堆叠ID
嵌
入
方
式
编码任意数量的输
入
ID图像,以保留ID信息。
PhotoMaker
文生图
人工智能
中国首份AIGC监管文件正
式
实
施——《生成
式
人工智能服务管理暂行办法》简析
《生成
式
人工智能服务管理暂行办法》解析 1、适用范围 根据管理办法第二条的规定: 利用生成
式
人工智能技术向中华人民共和国境内公众提供生成文本、图片、
音
频、视频等内容的服务
人工智能
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
但是近期,网易有道AI算法团队也开源了一款国产TTS
语
音
合成引擎EmotiVoice,刚上线仅一周
时
间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。
EmotiVoice
语音库
微调
2024!深
入
了解 大
语
言模型(LLM)微调方法(总结)
「当以上方
式
无法解决相关问题
时
,这就需要LLM微调」。
大模型
微调
Stable Diffusion
这篇深
入
浅出帖助你早日
实
现Stable diffusion自由
1、提示词:指挥AI作图的咒
语
WebUI 中被我们输
入
进去的描述文字或图像信息,就是 Prompts (提示词):用于生成图像的文字输
入
,需要使用英文输
入
,但你也可以通过探索 Extensions
AI图片
国内厂商
语
音
识别与Whisper评测:现状与概况对比
同
时
,Whisper(飞思卡尔
语
音
识别技术)作为一项国际上也备受关注的
语
音
识别技术,在
语
音
识别领域也有着广泛的应用。
语音识别
Faster-Whisper
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
一文读懂GPT-1:生成
式
预训练如何提升
语
言理解
为了深
入
探索大
语
言模型的发展历程,我们精心挑选了一系列经典论文进行分享,希望能与大家共同学习和理解大
语
言模型背后的技术。
GPT
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个
实
时
高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
Stable Diffusion
Stable Diffusion ComfyUI
入
门感受
模型载
入
节点将模型分成了 模型,clip层,VAE,clip层会在关键词编码的
时
候使用,VAE会在图片编码解码(图片RGB空间与潜空间转换)
时
使用 图片节点可以载
入
图片并转换到潜空间,或者创建新的潜空间空图片
文生图
DeepMusic发布“和弦派”2.0:重塑AI
音
乐创作范
式
,赋予创作者全方位掌控
4月29日,国内领先的人工智能
音
乐服务商DeepMusic,发布了自主研发的AI
音
乐工作站——“和弦派”2.0正
式
版。
和弦派
DeepMusic
音乐创作
清华
图片生成速度最高提升10倍!可以做到“
实
时
”生成!清华推出LCM/LCM-LoRA!
一般来说,SD模型需要25到50步才能生成一张图像,这对于
实
时
应用来说是不可接受的。
LCM/LCM-LoRA
文生图
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段
时
间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
深
入
浅出:大
语
言模型中必不可少的技术——Embedding简介
简单来说,embedding就是一个N维的
实
值向量,它几乎可以用来表示任何事情,如文本、
音
乐、视频等。
embedding
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100