首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 你的下一个浏览器,可以是豆包电脑版!
· MCP服务介绍及应用场景报告-来自Manus
· DeepMusic发布“和弦派”2.0:重塑AI音乐创作范式,赋予创作者全方位掌控
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
· 提示词框架:BROKE
· AI写作:如何用AI一键提炼文章要点,10倍提效(含提示词)
· Suno音乐新手指南(手把手完整版教程)
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
AI虚拟主播数字人技术实现Wav2Lip
本
文
主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于
文
本
生成视频的方法
今天给大伙分享一下目前来看比较稳定的
文
本
生视频的插件 AnimateDiff。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于
文
本
生成视频的方法!
今天给大伙分享一下目前来看比较稳定的
文
本
生视频的插件 AnimateDiff。
文本生成视频
AnimateDiff
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-instruct-300M:能够生成富有情感表现力的
语
音
,允许通过指令
文
本
进行精细调整。
asr
tts
声音
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
哪款
语
音
克隆模型最好,等你来评价~
本
文
案例效果仅供参考!
语音克隆
开源模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
RAG
一
文
看懂RAG:大
语
言模型落地应用的未来
其中一些主要限制包括: 不适应多模态数据:基础RAG主要关注
文
本
数据的检索和生成,对于多模态数据(例如图像、
音
频)的处理能力有限。
rag
检索增强
13.5K Star ! Fish Speech Windows
本
地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的
文
本
到
语
音
(TTS)工具,支持英
语
、日
语
、韩
语
、中
文
、法
语
、德
语
、阿拉伯
语
和西班牙
语
。
Fish
Speech
本地搭建
万字长
文
-大
语
言模型指令调优综述
在这种方法中,通过使用模板将
文
本
标签对
转
换为(指令、输出)对。
大语言模型
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
Agent
AI Agent的数字化革命:超越
文
本
,走向自主决策与交互
AI Agent和ChatGPT、Claude等LLM(大
语
言模型)有什么区别呢?
生成式AI
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长
文
本
中
文
任务第一
另外,大模型
本
身有着幻觉问题,检索增强也是最直接的解决方案。
大模型
Ziya
LLM
4种通过LLM进行
文
本
知识图谱的构建方法对比介绍
我们在以前的
文
章中已经介绍了使用大
语
言模型将非结构化
文
本
转
换为知识图谱。
知识图谱
大模型
大模型
8G显存一键训练,解锁Llama2隐藏能力!XTuner带你玩
转
大模型
自 ChatGPT 发布以来,大模型的强大让人们看见了通用人工智能的曙光,各个科技大厂也纷纷开源自家的大
语
言模型。
大模型
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
用户可以通过简单的
文
本
提示进行创作,生成多种
音
乐风格的高质量
音
乐和
语
音
。。
suno
音乐
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100