首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 搞了一个Dify开源知识库
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· ComfyUI 图片以及工作流管理神器
· AI换脸工具:facefusion使用心得
· AI+大模型在金融行业的应用场景
· 大模型量化:什么是模型量化,如何进行模型量化
· 十条最佳GPT提示词,让你成为任何领域大师
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish
Speech
Windows本地搭建,能否达到官方的级别?强烈推荐
Fish
Speech
是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-
Speech
)技术是一项可以将文本转换成语音的技术。
TTS
Maker
语音
开源
十大开源语音识别项目
Automatic
Speech
Recognition(ASR)是一项自动语音识别技术,其目标是通过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
OpenAI
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic
speech
recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford
语音转文字
whisper
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License,预训练模型是 CC-BY-NC license Fish-
Speech
语音克隆
开源模型
视频
Prompt | 抖音视频脚本
复制脚本并访问 https://beta.elevenlabs.io/
speech
-synthesis 以生成文本转语音。
prompt
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-
Speech
音乐
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文来自ACM 2020:A Lip Sync Expert Is All You Need for
Speech
to Lip Generation In the Wild 代码开源:https:/
wav2lip
语音
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
基本上你需要做的就是这样: 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-
speech
-recognition
音频
Whisper
语音
国内厂商语音识别与Whisper评测:现状与概况对比
二、评测意义与预期成果 语音识别(
speech
recognition)技术,也被称为自动语音识别(Automatic
Speech
Recognition, ASR)、电脑语音识别(Computer
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究成果:无监督语音到语音(Unsupervised
Speech
-to-
Speech
,简称USS)AI模型。
Translatotron
语音识别
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-
Speech
,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
ChatGPT
20个ChatGPT超实用的提示词(Prompt)
附加说明:演讲应在 15 分钟以内” 英文版:"Topic: How to write persuasively Audience: Business executives Format:
Speech
prompt
提示词
开源
6个最佳开源TTS引擎
04 MaryTTS https://github.com/marytts/marytts MARY Text-to-
Speech
语音合成是一个多语言TTS平台,支持英语(英国和美国)
TTS引擎
开源模型
Prompt
提高工作效率的 10 个高级Prompt
or content Sampleprompt: "Topic: How to write persuasively Audience: Business executives Format:
Speech
工作
大模型
GPT
prompt
提示词
<
1
2
>
1
2
4
5
6
7
8
9
100