首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 盘点字节跳动最新的AI应用
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Stable Diffusion 30种采样器全解!
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· 推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 一文汇总市面上所有prompts提示词框架
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· SD出图新思路
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish
Speech
Windows本地搭建,能否达到官方的级别?强烈推荐
Fish
Speech
是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-
Speech
)技术是一项可以将文本转换成语音的技术。
TTS
Maker
语音
开源
十大开源语音识别项目
Automatic
Speech
Recognition(ASR)是一项自动语音识别技术,其目标是通过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
OpenAI
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic
speech
recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford
语音转文字
whisper
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License,预训练模型是 CC-BY-NC license Fish-
Speech
语音克隆
开源模型
视频
Prompt | 抖音视频脚本
复制脚本并访问 https://beta.elevenlabs.io/
speech
-synthesis 以生成文本转语音。
prompt
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-
Speech
音乐
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文来自ACM 2020:A Lip Sync Expert Is All You Need for
Speech
to Lip Generation In the Wild 代码开源:https:/
wav2lip
语音
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
基本上你需要做的就是这样: 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-
speech
-recognition
音频
Whisper
语音
国内厂商语音识别与Whisper评测:现状与概况对比
二、评测意义与预期成果 语音识别(
speech
recognition)技术,也被称为自动语音识别(Automatic
Speech
Recognition, ASR)、电脑语音识别(Computer
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究成果:无监督语音到语音(Unsupervised
Speech
-to-
Speech
,简称USS)AI模型。
Translatotron
语音识别
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-
Speech
,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
ChatGPT
20个ChatGPT超实用的提示词(Prompt)
附加说明:演讲应在 15 分钟以内” 英文版:"Topic: How to write persuasively Audience: Business executives Format:
Speech
prompt
提示词
开源
6个最佳开源TTS引擎
04 MaryTTS https://github.com/marytts/marytts MARY Text-to-
Speech
语音合成是一个多语言TTS平台,支持英语(英国和美国)
TTS引擎
开源模型
Prompt
提高工作效率的 10 个高级Prompt
or content Sampleprompt: "Topic: How to write persuasively Audience: Business executives Format:
Speech
工作
大模型
GPT
prompt
提示词
<
1
2
>
1
2
4
5
6
7
8
9
100