首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
· 一文汇总市面上所有prompts提示词框架!
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· Python程序混淆和打包exe文件流程和方法
· 用GPT4创建一部连环画故事
· 你的下一个浏览器,可以是豆包电脑版!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点
· 用 Stable Diffusion 10分钟实现电商模特换装/换模特
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Python
Whisper对于中文
语
音
识别与转写中文文本
优
化
的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的
语
音
做一些
优
化
的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
Stable Diffusion
Stable Diffusion 加速/
优
化
/升级
优
化
出图速度
秋叶整合版
优
化
1.
Stable
Diffusion
文生图
OpenAI
【
语
音
识别】OpenAI
语
音
力作Whisper
A:因为许多ASR的训练
语
料都对转写文本做了标准
化
,比如删除或规范
化
了从
音
频信号中难以预测的方面,例如复杂的标点符号(感叹号、逗号和问号)、格式
化
空白(例如段落)或风格大小写等方面。
语音转文字
whisper
大模型
大模型检索增强生成RAG的
优
化
RAG
优
化
分为两个方向:RAG基础功能
优
化
、RAG架构
优
化
。
RAG
检索增强
大模型
工具
Prompt提示
优
化
工具
prompt perfect 可以自动
优
化
已有的提示,比较多个模型的输出,运行智能体等。
prompt
提示词
关于AI声
音
生成的一切(
语
音
+
音
乐+嘴型)
解压就能用): OpenAI Whisper自动
语
音
识别模型的高性能GPGPU推理 ,基于DirectCompute技术,对Windows系统进行了
优
化
,并且在性能和内存使用上
优
于原始OpenAI实现。
声音
用AI生成PPT、用AI
优
化
PPT!
下图里的页面主题,我猜测是因为GPT4将图片内容先转成英文,再转成中文输出,发生了
语
言转换的不对应问题。
AI
ppt
用AI生成PPT、用AI
优
化
PPT
下图里的页面主题,我猜测是因为GPT4将图片内容先转成英文,再转成中文输出,发生了
语
言转换的不对应问题。
ppt
AI生成PPT
Prompt
自动
优
化
Prompt:Automatic Prompt Engineering的3种方法
无论是想“提分”、还是想
优
化
LLM标注器的效果、或是想根据用户反馈来
优
化
Prompt进而提升产品体验,这些方法都可以借鉴。
prompt
大模型
开源
网易(TTS)EmotiVoice:开源
语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用一句简单的提示来控制你的
语
音
合成器,那该多方便?
EmotiVoice
语音合成
Prompt
写不好Prompt?可以先写个粗糙版本,然后让GPT帮助
优
化
。
我们以学习“如何写好Prompt”为例看
优
化
过程。
Prompt
GPT
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
按照固有的思维方式,如果想要
语
音
克隆首先得有克隆对象具体的
语
言
语
音
样本,换句话说,克隆对象必须说过某一种
语
言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨
语
种无需训练的
语
音
克隆技术
coqui-ai
TTS
语音
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG
优
化
LLMs实现
大型
语
言模型(LLMs)已经展示出了令人印象深刻的能力,可以存储和部署大量知识以响应用户查询。
RAG
大模型
自动回复
工具
AI文本转
语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转
语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英
语
、西班牙
语
、法
语
、中文、日
语
和韩
语
等多种
语
言。
MeloTTS
语音工具
开源
阿里巴巴
语
音
实验室发布开源
语
音
处理框架ClearerVoice-Studio,支持
语
音
增强、分离、目标说话人提取
.02 技术亮点:多模型协作,创新驱动性能突破 ClearerVoice-Studio 的核心
优
势在于其精心设计的模型体系,针对不同的
语
音
处理任务量身打造了多款创新模型
ClearerVoice-Studio
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100