首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI换脸工具:facefusion使用心得
· MCP服务介绍及应用场景报告-来自Manus
· 我用AI写小说:「国学篇」如何将国学插入小说中
· 9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
· 使用自己的数据训练清华ChatGLM2-6B 模型
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· ComfyUI官方使用手册【官网直译+关键补充】
· [Stable Diffusion]SD安装、常用模型(checkpoint、embedding、LORA)、提示词具、常用插件
· YOO简历
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术转移到多说话人
文
本到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
开源
十大开源
语
音
识别项目
)是 Meta 开源的一款全新的 AI
语
言模型,可以识别 4000 多种口头
语
言并
生
成 1100 多种
语
音
(
文
本到
语
音
),可谓是“
语
音
巴别塔”。
语音识别
开源项目
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生
成技术,不仅能可能声
音
,还能通过对声
音
的描述来
生
成独特的
音
色,同时还能通过描述来
生
成各种各样的
音
效,甚至能通过
文
字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生
成技术的所有的需求
Meta
语音生成
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
一
文
读懂GPT-1:
生
成式预训练如何提升
语
言理解
为了深入探索大
语
言模型的发展历程,我们精心挑选了一系列经典论
文
进行分享,希望能与大家共同学习和理解大
语
言模型背后的技术。
GPT
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,
语
言模型缺乏像人类一样感知非
文
本模态(如图像和
音
频)的能力。
大模型
语音
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
它包含了两个最先进的 AI
生
成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以产
生
高质量
音
频。
AudioCraft
音频
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本
文
将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中
文
情感端 - 端
语
音
交互大模型
此外,端到端的设计是它的一大亮点,这种设计直接从
文
本输入
生
成
语
音
输出,无需繁琐的中间环节,极大地提高了
语
音
合成的效率和准确性。
Westlake
-
Omni
语音
「
语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,
语
音
识别技术的突破性进展尤为引人瞩目。
Whisper
语音识别
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英
文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
教程
【万字长
文
-进阶教程】一
文
带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
ChatTTS是专门为对话场景设计的
文
本转
语
音
模型,例如LLM助手对话任务。
chattts
tts
文生语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100