首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· 从第一性原理看大模型Agent技术
· AI换脸工具:facefusion使用心得
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 40个prompt,让你成为麦肯锡高手
· TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
· Stable Diffusion 30种采样器全解!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
关于AI声音生成的一切(语音+音乐+嘴型)
2D/3D/视
频
生成最近都有很多值得关注的工具,但是要输出完整的AIGC作品,肯定少不了声音。
声音
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
, '日语男', '粤语女', '英文女', '英文男', '韩语女'; 运行结果:对应合成的音
频
效果展示: sft_中文女代码合成,z先生的备忘
录
,31秒 粤语女声案例展示
asr
tts
声音
Stable Diffusion
Stable Diffusion|儿童绘本全流程制作分享
上次分享了一个将小说转化为视
频
的全过程的教程。
StableDiffusion
绘本
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
,文末我给大家准备好了,不需要你去爬梯子下载了 注意一点下载并将 ffmpeg.exe 和 ffprobe.exe 放置在 GPT-SoVITS 根目
录
下
数字人
声音克隆
GPT-SoVITS
数字人
划重点!全网最全AI数字人工具合集!
· 选择语音:输入文字或
录
制语音,让数字人“说出”你想让他/她表达的内容。
AI
数字人
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
其核心功能是通过提供发言者的短音
频
片段(参考语音),实现声音的高效克隆。
tts
文本转语音
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或视
频
中的人体关键点,并且能够识别不同的身体部位和动作。
行为识别
姿态识别
开源
SD3 正式开源 Sora同源架构
2月16日伴随着OpenAI世界大模型Sora的发布,stability_ai也发布了其最新的模型Stablediffusion3,如果说一个是音视
频
方向
SD3
绘画
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够同时处理多个音
频
片段,大幅缩短了从语音到文本的转换时间。
Whisper
语音识别
换脸
Roop升级版FaceFusion换脸AI技术使用以及部署教程
首先我们需要确认一个工作目
录
,用来存放facefusion的相关环境依赖文件。
FaceFusion
教程
换脸
换脸软件 FaceFusion 保姆级教程
FaceFusion 是由 Roop 项目的核心开发者独立发布的,它被官方描述为下一代的人脸交换和增强软件,这个软件可以用于处理图片和视
频
,可以运行在 GPU 和 CPU 下面。
FaceFusion
教程
开源
精通百种语言的翻译AI来了!Meta推出,免费、开源!
这个模型可以实现近101种语言之间的文本、音
频
、视
频
等多种形式的翻译,而且只需要一个模型就可以完成所有任务。
大语言模型
教程
用so-vits-svc-4.1进行音色转换的极简教程
其实歌声转换不仅仅适用于歌声,普通讲话也可以,只是歌唱的音调基本能覆盖到低、中、高全域声音类型,而正常说话可能无法做到全域覆盖,但是如果在
录
制声音的时候能够做到覆盖多种音调类型,也可以实现声音转换。
声音
sovits
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
写一篇关于Vision Pro VR眼镜的20字宣传文案,并用女声读出来,同时生成个视
频
看看。
大模型
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
视
频
生成 对视
频
进行解析匹配视
频
信息进行生成 video-editing 视
频
编辑 对视
频
进行解析转化为可编辑状态
开源
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100