首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
· 你的下一个浏览器,可以是豆包电脑版!
· 清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4是全能战士,超越所有模型
· ComfyUI 基础教程(二):文生图基础流程
· 懒人福音!用AI生成会议纪要,让你的工作更高效!
· 一键AI换脸!小红书和北大合作的InstantID
· 十大开源语音识别项目
· 用AI生成PPT、用AI优化PPT!
· OpenAI开源大模型调测工具Transformer Debugger:可以在训练大模型之前理解模型的运行情况并干预
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
【语
音
识别】OpenAI语
音
力作Whisper
与Wav2Vec 2.0等前作不同,以往的模型都是在未标注的
音
频
数据上预训练的,而 Whisper 是在大量的已标注
音
频
转录数据上预训练的。
语音转文字
whisper
Insanely Fast Whisper:超快的Whisper语
音
识别脚本
通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的
音
频
。
音频
Whisper
AI
音
乐热潮下,“神曲工作室”率先失业
她觉得,AI
音
乐可能会对抖
音
等平台上批量产出的歌曲产生较大影响,甚至不排除视
频
平台自主引入AI作曲机制,影响由第三方负责的“神曲”创作的生存空间。
音乐
音频
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片
音
频
可以生成,而用自己的图片、
音
频
生成视
频
就不行。
SadTalke
下载
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,
音
乐、视
频
、图像、文件等!
看到网上有超赞的视
频
、
音
乐或图片,却无法轻松地保存到自己的电脑或手机上?
AixDownloader
下载
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视
频
融合语
音
(这里的核心都是人物口型与
音
频
中的语
音
唇形同步)。
数字人
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频
驱动唇部同步模型。
MuseTalk
数字人
音频
ChatGPT
15种ChatGPT高
频
用法
本文列出了15个可以高频使用chatgpt以及其他大模型的场景,希望对您会有启发
大模型
效率
工具
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视
频
、AI语
音
...
涵盖了 AI 绘画、AI 视
频
、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
尽管这个项目专注于财经领域,但他们认识到
音
频
AI在更广泛的
音
乐创作领域内的潜力。
suno
音乐
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频
驱动的视
频
生成领域,制作普通话视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视
频
焕发新生!
上传一段视
频
,AI 自动识别视
频
中的运动主体人物,并一键替换成有趣的 3D 角色模型,生成与众不同的 AI 视
频
。
阿里云
视频
音频
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频
数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦克风的实时
音
频
输入和预先录制的
音
频
文件。
OpenAI
Whisper
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100