首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 盘点数据安全合规方向的热门证书【快来了解一下】
· Stable Diffusion 30种采样器全解!
· 大模型评测新思路:弱智吧精华问题大全
· 超越RAG:揭秘IAG框架如何引领推理问答系统的创新之路
· OCR的终极解法——传统算法VS多模态大模型
· 国内首个!最火的MoE大模型APP来了,免费下载,人人可玩
· 免配置、免翻墙,Stable Diffusion平替来了!
· 社区供稿|GPT-4 与国产模型,大!横!评!
· 震撼科技界:清华大学与智谱AI联手,引领中文长文智能写作新纪元!
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为文本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
大模型
中国大模型融资暗战:罗曼蒂
克
的快速消亡
多位接近闫俊杰的人士表示,“闫俊杰是典型的技术宅,说话声
音
小,可能并不擅长对外”,所以平时公司对外融资、以及一些管理、外部活动也通常由贠烨祎负责。
大模型
暗战
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
创始团队 Mikey Shulman:担任首席执行官,他曾担任Kensho的机器学习主管,麻省理工学院斯
隆
管理学院的讲师,哥伦比亚大学应用物理专业的学士学位和哈佛大学物理学专业的博士学位;
suno
音乐
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
ChatTTS是专门为对话场景设计的文本转
语
音
模型,例如LLM助手对话任务。
chattts
tts
文生语音
第一性原理以及第一性原理是怎么帮马斯
克
成为首富的
第一性原理是怎么帮马斯
克
成为首富的?
马斯克
商业
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换成
语
音
的AI工具。
TTS
文本转语音
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
比如,我们知道某些人在特定条件下会表现出某种行为(“普利
克
效应”、“达纳效应”等),但我们并不真正理解为什么会这样。
大语音模型
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
阿里
《嬛嬛朕emo啦》但马斯
克
!阿里这项技术开放试玩
等了7分多钟,刚从北京闪现闪离的马斯
克
,他终于夸我是个人才: ,时长00:03 好了,别骂诈骗,我全都招!
音频
阿里
数字人
划重点!全网最全AI数字人工具合集!
· 选择
语
音
:输入文字或录制
语
音
,让数字人“说出”你想让他/她表达的内容。
AI
数字人
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100