首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
包括拥有哈佛物理学博士学位的Mikey Shulman在内的创始人都是
音
乐家,他们将Suno
视
为解决
音
乐听众与创作者之间数量不平衡的工具。
suno
音乐
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
OpenVoice 只需要来自目标说话者的简短
音
频
样本即可准确复制其独特的声调和特征。
OpenVoice
声音克隆
开源
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦克风的实时
音
频
输入和预先录制的
音
频
文件。
OpenAI
Whisper
大模型
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频
数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
人工智能
6个AI
音
乐软件推荐,让你学会人工智能AI作曲
这款AI
音
乐生成器支持为任何
视
频
或游戏创作
音
乐,它还附带一个免版税的
音
乐生成器,以避免与授权有关的问题。
训练
音乐
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
,即便通过
视
频
扩展等手段,最多也只能生成十几秒的
视
频
。
视频生成
sora
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
选择喜欢的
音
频
片段,并上传一张大头照。
音频
阿里
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
前段时间,「霉霉大秀中文」的
视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似
视
频
。
语音
HeyGen
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
采用Video2Motion,基于
视
频
人物动作驱动3D数字人;人物唱演
视
频
生成框架Emote Portrait Alive能够基于单张图和
音
频
,输出准确、生动的人物唱演
视
频
。
通义
文生视频
开源
开源语
音
大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
使LLMs能够感知和理解丰富的
音
频
信号以进行
音
频
交互引起了广泛关注。
大模型
语音
大模型
“实时”语
音
翻译!AI语
音
具有“情绪”!最强开源AI大模型来了
你想把一段语
音
转成文字,或者把一段文字转成语
音
,但是你不知道怎么操作!
大模型
开源模型
语音
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
首先从数据开始: 如果你想克隆一个人的声
音
,你可以找到一段这个人的演讲录
音
,或者
视
频
,当然不同资源需要不同的处理 如果是
视
频
,可以使用 人声分离,如下图,点击这个就会弹出
数字人
声音克隆
GPT-SoVITS
OpenAI
基于 OpenAI Whisper 模型的实时语
音
转文字工具
今天给大家分享一款专注于
音
频
处理和创作的开源软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100