首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 理解 o3 及其技术分析
· ChatLaw
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 揭秘数字人困境:代理商亏钱、直播屡被封、刘润也不用了
· AI 爆文写作:如何用GPT写出10万+?这篇五千字长文给你答案
· Math.now
· 变天了,AI可以一键生成中文海报了......
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Agent
10个具有代表性的AI-Agents,将如何改变
互
联网/重塑Web3
,也可以与虚拟小镇的所在环境发生
交
互
,并且还可以与虚拟世界之外的人类产生
交
互
。
开源模型
开源
OpenAI真的开源了!这波「实时
语
音
」操作,让万物开口说话,我爱了
简单点说,就是一个“大脑”,能装进各种小玩意儿里,能让各种设备(比如毛绒玩具)具备实时
语
音
交
互
的能力。
OpenAI
嵌入式实时语音
SDK
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为文本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
今天介绍一个开源的完整的数字人项目:Fay Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、
语
音
助理、远程
语
音
助理、数字人
互
动、心理测评
Fay
开源项目
数字人
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
大模型
一个万能提问公式,让大模型生成高质量回答
在讲万能提问公式前,我们需要先了解什么是 Prompt:首先,ChatGPT 从本质上讲是一个
语
言大模型。
提示词
大模型
评论能力强于GPT-4,上
交
开源13B评估大模型Auto-J
为此,上海
交
通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐评估工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐评估。
Auto-J
大模型
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
MCP服务介绍及应用场景报告-来自Manus
随着大型
语
言模型能力的不断提升,它们与外部世界
交
互
的需求也日益增长。
MCP
大模型
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
从
音
乐制作到分发,AI 技术的应用可能会导致新的商业模式和服务的出现,从而影响
音
乐创作者、发行商和消费者的
互
动。
suno
音乐
数字人
数字人:从科幻走向现实的技术革命
3.
语
音
合成:
语
音
合成技术可以为数字人提供逼真的
语
音
输出能力。
数字人
语音
金融
MCI-GRU:在真实金融
交
易中验证有效的股票价格预测模型
其次,设计了多头
交
叉注意力机制,以学习不可观测的潜在市场状态表示,并通过与时间特征和横截面特征的
交
互
进一步丰富这些表示。
MCI-GRU
股票
大模型
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性化的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
大模型
AI大模型LLM可以帮助企业做什么?
通过
语
音
交
互
、图像处理等技术,辅助企业内部运营。
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100