首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· stable diffusion十七种controlnet详细使用方法总结
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· 大模型评测新思路:弱智吧精华问题大全
· 零门槛的 4 大 AI 提示词法则,让你的 AI 助手秒变效率神器
· OpenAI视频模型Sora的推理生成成本多高?
· 用so-vits-svc-4.1进行音色转换的极简教程
· OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
· 迄今为止,最强ChatGPT写论文技巧,总共6步,手把手告诉你!
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术转移到多说话人
文
本到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生
成技术,不仅能可能声
音
,还能通过对声
音
的描述来
生
成独特的
音
色,同时还能通过描述来
生
成各种各样的
音
效,甚至能通过
文
字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生
成技术的所有的需求
Meta
语音生成
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
一
文
读懂GPT-1:
生
成式预训练如何提升
语
言理解
为了深入探索大
语
言模型的发展历程,我们精心挑选了一系列经典论
文
进行分享,希望能与大家共同学习和理解大
语
言模型背后的技术。
GPT
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,
语
言模型缺乏像人类一样感知非
文
本模态(如图像和
音
频)的能力。
大模型
语音
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
它包含了两个最先进的 AI
生
成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以产
生
高质量
音
频。
AudioCraft
音频
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
「
语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,
语
音
识别技术的突破性进展尤为引人瞩目。
Whisper
语音识别
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本
文
将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英
文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
前不久小圈为大家介绍过 Coqui
文
本转
语
音
(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
教程
【万字长
文
-进阶教程】一
文
带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
ChatTTS是专门为对话场景设计的
文
本转
语
音
模型,例如LLM助手对话任务。
chattts
tts
文生语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100