首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 理解 o3 及其技术分析
· 深度体验3天后,我把腾讯这款copilot锁进了程序坞
· 使用知识图谱提高RAG的能力,减少大模型幻觉
· AI写作:一步到位,如何用 AI 生成整篇文章?做自媒体必看!
· 掌握这10个AI 工具用1小时完成别人1周的工作
· Stable Diffusion 30种采样器全解!
· 基于 OpenAI Whisper 模型的实时语音转文字工具
· 弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish
Speech
Windows本地搭建,能否达到官方的级别?强烈推荐
Fish
Speech
是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-
Speech
)技术是一项可以将文本转换成语音的技术。
TTS
Maker
语音
OpenAI
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic
speech
recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford
语音转文字
whisper
开源
十大开源语音识别项目
Automatic
Speech
Recognition(ASR)是一项自动语音识别技术,其目标是通过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License,预训练模型是 CC-BY-NC license Fish-
Speech
语音克隆
开源模型
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-
Speech
音乐
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
它集成了先进的语音增强(
Speech
Enhancement)、语音分离(
Speech
Separation)和音视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频
ClearerVoice-Studio
语音
视频
Prompt | 抖音视频脚本
复制脚本并访问 https://beta.elevenlabs.io/
speech
-synthesis 以生成文本转语音。
prompt
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文来自ACM 2020:A Lip Sync Expert Is All You Need for
Speech
to Lip Generation In the Wild 代码开源:https:/
wav2lip
语音
语音
国内厂商语音识别与Whisper评测:现状与概况对比
二、评测意义与预期成果 语音识别(
speech
recognition)技术,也被称为自动语音识别(Automatic
Speech
Recognition, ASR)、电脑语音识别(Computer
语音识别
Faster-Whisper
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
基本上你需要做的就是这样: 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-
speech
-recognition
音频
Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究成果:无监督语音到语音(Unsupervised
Speech
-to-
Speech
,简称USS)AI模型。
Translatotron
语音识别
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-
Speech
,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
开源
6个最佳开源TTS引擎
04 MaryTTS https://github.com/marytts/marytts MARY Text-to-
Speech
语音合成是一个多语言TTS平台,支持英语(英国和美国)
TTS引擎
开源模型
Prompt
提高工作效率的 10 个高级Prompt
or content Sampleprompt: "Topic: How to write persuasively Audience: Business executives Format:
Speech
工作
大模型
GPT
prompt
提示词
<
1
2
>
1
2
4
5
6
7
8
9
100