首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为
视
频
。
AnimateDiff
视频
训练
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
包括拥有哈佛物理学博士学位的Mikey Shulman在内的创始人都是
音
乐家,他们将Suno
视
为解决
音
乐听众与创作者之间数量不平衡的工具。
suno
音乐
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频
数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
,即便通过
视
频
扩展等手段,最多也只能生成十几秒的
视
频
。
视频生成
sora
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦克风的实时
音
频
输入和预先录制的
音
频
文件。
OpenAI
Whisper
大模型
人工智能
6个AI
音
乐软件推荐,让你学会人工智能AI作曲
这款AI
音
乐生成器支持为任何
视
频
或游戏创作
音
乐,它还附带一个免版税的
音
乐生成器,以避免与授权有关的问题。
训练
音乐
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
选择喜欢的
音
频
片段,并上传一张大头照。
音频
阿里
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
前段时间,「霉霉大秀中文」的
视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似
视
频
。
语音
HeyGen
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
采用Video2Motion,基于
视
频
人物动作驱动3D数字人;人物唱演
视
频
生成框架Emote Portrait Alive能够基于单张图和
音
频
,输出准确、生动的人物唱演
视
频
。
通义
文生视频
开源
开源语
音
大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
使LLMs能够感知和理解丰富的
音
频
信号以进行
音
频
交互引起了广泛关注。
大模型
语音
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
OpenVoice 只需要来自目标说话者的简短
音
频
样本即可准确复制其独特的声调和特征。
OpenVoice
声音克隆
开源
OpenAI
基于 OpenAI Whisper 模型的实时语
音
转文字工具
今天给大家分享一款专注于
音
频
处理和创作的开源软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音
频
克隆的开源项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100