首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI
换
脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
:使用来自 ddcolor 和 deoldify 的先进模型,为黑白或低
色
彩素材添加
色
彩。
FaceFusion
文生图
DeepMusic发布“和弦派”2.0:重塑AI
音
乐创作范式,赋予创作者全方位掌控
4月29日,国内领先的人工智能
音
乐服务商DeepMusic,发布了自主研发的AI
音
乐工作站——“和弦派”2.0正式版。
和弦派
DeepMusic
音乐创作
将文本
转
化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
这是一款基于生成式AI的工具,可以将文本提示无缝
转
换
为复杂的3D动画,简化了动画创作过程,同时也超越了物理障碍,使得更多不同类型的创作者和行业可以使用3D动画。
3D
动作捕捉
字正腔圆,万国同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象具体的语言语
音
样本,
换
句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
实时语
音
克隆
项目简介 这份内容介绍了实时语
音
克隆的技术实现,作者通过将说话者验证技术
转
移到多说话人文本到语
音
合成(SV2TTS)来实现语
音
克隆。
语音
克隆
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到语
音
转
换
。
数字人
声音克隆
GPT-SoVITS
教程
Roop升级版FaceFusion
换
脸AI技术使用以及部署教程
一、介绍: 前些日子比较火的
换
脸AI技术是Roop,但是Roop已经停止更新了,好像是因为团队成员用这个东西搞颜
色
吧。
FaceFusion
教程
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
其具体的技术流程主要包括以下几个关键步骤 : 1、数据预处理:首先,对输入的
音
频文件进行采样率
转
换
和分帧等预处理操作。
clone-voice
声音克隆
工具
FaceSwapLab,截止2023年8月最好用的一键
换
脸工具
几周前,我介绍了基于stable diffsion的一个
换
脸插件:roop(这个插件也有独立版,功能更多,甚至可以给视频
换
脸)。
一键换脸
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示
转
换
为视频。
AnimateDiff
视频
训练
Agent
为什么大佬都在说Agent是未来?
换
个角度来谈一谈
这和我们在抖
音
或者小红书上看到了内容攻略没有本质区别,其核心差异在于内容制造的效率和质量。
Agent
大模型
开源
十大开源语
音
识别项目
Automatic Speech Recognition(ASR)是一项自动语
音
识别技术,其目标是通过计算机自动将人类口头语
音
转
录为文本。
语音识别
开源项目
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
教程
Suno
音
乐新手指南(手把手完整版教程)
为方便更多
音
乐爱好者使用AI创作
音
乐,中国AIGC产业联盟(AIGCxChina)发起了Suno爱好者社群并编写了以下指南。
suno
歌曲
教程
Stable Diffusion
Stable Diffusion教程:采样器
简单点说,前向扩散是将图片
转
换
为数据模型,而后向扩散是从数据模型生成图片。
画图
SD
采样器
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100