首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了!
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 剪映专业版智能补帧
· Fooocus,webui,comfyui优缺点
· TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
· 第3期 SDXL和SD的10大区别!你知道几个?
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· MCP服务介绍及应用场景报告-来自Manus
· Stable Diffusion WebUI v1.8.0重大更新!
· 开源大语言模型完整列表
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程
AI
声
音
模型训练是通过分析大量
音
频数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
开发语
音
产品时设计唤醒词和命令词的技巧
在实际开发语
音
产品过程中,要达到好的语
音
识别效果,除了语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
这些视频很多都出自一个名叫「HeyGen」的
AI
应用之手。
语音
HeyGen
工具
惊艳推荐!8款好用又免费的文本转语
音
TTS工具
在早期,TTS技术主要依赖于预录制的声
音
样本,通过组合这些样本来生成语
音
。
TTS
Maker
语音
ChatGPT
把ChatGPT装进二次元手办,你来吗?
AI
桌面机器人众筹
内置的
AI
对话模块。
ai小车
esp32
开源
大模型
我为什么不看好大模型行业
展望未来总是宏大而
乐
观的,这一篇则恰恰相反。
大模型
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结合起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
Python
Whisper对于中文语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
开源
OpenAI 开源语
音
识别 Whisper 的使用体验怎么样?
近期,
AI
领域异常热门,众多惊人且令人担忧的工具不断涌现。
生成式AI
开源
网易有道强力开源中英双语语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
从 GPT-4o 到 LiveKit:实时语
音
交互的开源实现
LiveKit 不仅有一个开源的 voice agent 方案[1],还能为你提供一个成熟且强大的实时多模态
AI
解决方案。
GPT-4o
语音交互
大模型
真超越了GPT?国产大模型实用场景横评②
这是娱
乐
资本论·视智未来在第一次做大语言模型文本应用能力测试时,写下的第一句话。
大模型
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的
AI
模型,这项黑科技让视频配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
开源
OpenAI真的开源了!这波「实时语
音
」操作,让万物开口说话,我爱了
以前,智能玩具里只能播放预设的程序和声
音
,顶多就是进行一两轮简单提问,你可以理解成是“单向输出”,现在有了这个 openAI 的实时语
音
软件开发包,就变成了“双向交互”,能和你进行实时的语
音
对话。
OpenAI
嵌入式实时语音
SDK
工具
TTS,一个奇妙的
AI
工具
简介 TTS是一个将文本变换成语
音
的
AI
工具。
TTS
文本转语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100