首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频魔法
开源
十大开源语音识别项目
本文介绍了十个与自动语音识别(ASR)技术相关的开源项目,包括Whisper、Massively Multilingual Speech、DeepSpeech、PaddleSpeech、ESPnet、ASRT、SpeechBrain、WeNet、MASR和FunASR。这些项目在语音识别领域具有重要意义,支持多种语言,并提供了丰富的功能和工具。此外,文章还介绍了趋动云作为领先的算力服务商,在ASR科研方面的优势和支持。这些资源和工具为ASR技术的发展提供了有力支持,促进了该领域的进步。
开源项目
语音识别
2024-04-09
2024-04-09
AI+音乐|对话 Suno CEO:破圈的音乐生成产品是如何诞生的?
Suno AI是一款由麻省理工团队开发的强大人工智能音乐生成器,于2022年创立,创始团队包括Mikey Shulman和Camachoeorg Kucsko等专家。Suno通过结合人工智能技术与音乐创作,降低了音乐制作的门槛,为音乐爱好者和专业人士提供了新的创作工具,推动了音乐创作的民主化。它不仅能生成音乐的旋律和伴奏,还能创作歌词和人声,提供基础模式和自定义模式两种创作方式。在最新的V3版本中,Suno引入了更多自然的人声和为用户提供更细致创作控制的新功能。 Suno不仅关注于音乐创作,也致力于探索新的音乐消费和分享方式。它使音乐创作更加普及和个性化,改变了人们与音乐的关系,促进了音乐作为一种表达和沟通方式的发展。同时,Suno也提供了一个平台,让创作者可以分享自己的音乐作品,发现来自世界各地的创作者和他们的作品,从而激发新的灵感和创意。这种跨文化的交流和合作将推动音乐的创新,使其成为一种真正全球化的语言。 总的来说,Suno AI的出现为音乐创作和消费带来了革命性的变化,它降低了音乐创作的门槛,推动了音乐创作的民主化,同时也为音乐产业带来了新的商业模式和服务的可能性。
AI音乐
SunoCEO
2024-04-07
2024-04-07
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
AudioCraft 是一个用于音频生成的 PyTorch 库。它包含了两个最先进的 AI 生成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以产生高质量音频。
AudioCraft
音频
2024-04-03
2024-04-03
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现语音驱动唇部运动的!
wav2lip
语音
2024-04-01
2024-04-01
语音
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语音克隆技术。
coqui-ai
TTS
语音
2024-04-01
2024-04-01
视频
图文生成短视频的方法
本文探讨了作者从不喜欢做口播到利用AI工具和剪映软件成功制作短视频的过程。作者提到,利用剪映的“图文生成视频”模块和AI工具如百度文心一言、阿里通义千问等,可以快速生成视频文案并一键生成视频。然后,通过三个步骤进行剪辑:替换素材/修改字体、插入配置好的音频、在电脑上使用剪辑软件将视频素材和音频素材对齐。最后,作者鼓励读者多练习,以制作更加炫酷的视频效果。
视频
ChatGPT
2024-03-27
2024-03-27
教程
Suno音乐新手指南(手把手完整版教程)
本文介绍了Suno这款AI音乐创作工具的使用方法和技巧。用户可以通过注册并登录Suno,选择Custom Mode输入歌词,并选择相应的曲风提示词,生成个性化的音乐。文章还提供了关于Suno的一些基本信息,如每日免费credit数量、付费用户权益等。此外,文章还详细介绍了Suno的歌词创作和编辑技巧,包括如何输入歌词、选择风格、设置名字、生成音乐等。最后,文章还提供了关于Suno元标签的使用方法和技巧,帮助用户更好地利用这些标签来指导AI歌手创作和演绎歌曲。
suno
歌曲
教程
2024-03-25
2024-03-25
打造音乐传奇:Suno推出音乐生成模型Suno V3,让每个人都能成为作曲家
Suno AI的新音乐生成模型Suno V3在音乐界掀起了一场革命。这款模型以惊人的创作速度和多元化的音乐风格迅速走红,为音乐爱好者和专业制作人提供了一个全新的创作平台。 Suno V3能够在短短1分钟内创作出长达两分钟的完整歌曲,这一速度在传统音乐创作中是难以想象的。同时,该模型还能够轻松掌握各种音乐风格和流派,包括古典、爵士、Hip-hop和电子音乐等,满足了不同人群的需求。 除了
suno
歌曲
音乐
2024-03-25
2024-03-25
开源
网易有道强力开源中英双语语音克隆
网易有道强力开源中英双语语音克隆
语音
开源
2024-03-22
2024-03-22
开源
Stability AI开源上新:3D生成引入视频扩散模型
Stable Diffusion背后公司Stability AI又上新了。这次带来的是图生3D方面的新进展:基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。
sv3d
建模
2024-03-21
2024-03-21
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
VividTalk由南京大学、阿里巴巴、字节跳动和南开大学联合发表。它通过先进的音频到3D网格映射技术和网格到视频的转换技术,实现了高质量、逼真的音频驱动的说话头像视频生成。只需提供一张人物的静态照片和一段语音录音,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
2024-03-21
2024-03-21
语音
关于AI声音生成的一切(语音+音乐+嘴型)
2D/3D/视频生成最近都有很多值得关注的工具,但是要输出完整的AIGC作品,肯定少不了声音。其实声音生成也有很多革命性的工具,例如高质量的声音识别、文字转成人声、人声克隆、音乐生成,已经能组成完整工作流了,其中一些工具甚至已经打包好了,只要下载解压就能用!
声音
2024-03-21
2024-03-21
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视频很多都出自一个名叫「HeyGen」的 AI 应用之手。
语音
Whisper
2024-03-20
2024-03-20
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
这次AI要革翻译的命了么?!(先别急着骂,我们先看看产品) 你是否遇到过这样的情况: 你想和一个说不同语言的人交流,但是你不会他的语言! 你想把一段语音转成文字,或者把一段文字转成语音,但是你不知道怎么操作! 你想把一种语言的语音或文字直接转换成另一种语言的语音或文字,但是你需要用多个工具,而且效果不理想! 如果你有这样的困扰,那么你一定会对meta的开源AI模型seamless-communication感兴趣。
大模型
开源
语音
2024-03-19
2024-03-19
教程
用so-vits-svc-4.1进行音色转换的极简教程
这篇文章介绍了使用so-vits-svc项目进行声音转换的过程,包括歌声和普通讲话的转换。文章强调了声音转换需要采集和处理语音干声,以及训练声音主模型的重要性。文章还提供了详细的步骤和工具推荐,如使用Slicer-gui进行人声分离,租用服务器实例进行模型训练,以及使用webui页面或脚本命令进行模型推理。最后,文章提供了训练模型和推理的示例命令。
声音
sovits
2024-03-13
2024-03-13
<
1
2
3
4
5
6
7
8
9
>
1
2
4
5
6
7
8
9
100