首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
他设想了一个不懂中文的英
语
母
语
者被关在一个装满中文符号和指令书的房间里。
大语音模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英文全名是 Text To Speech,中文译名是“文本转
语
音
”。
声音克隆
教程
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出。
OpenAI
Whisper
大模型
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
我,大
语
言模型
作为大
语
言模型,我只前向思考,不反向思考。
大模型
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
:5款
语
音
克隆模型效果展示 案例1: 萝莉
语
音
克隆-5款模型
语
音
克隆--效果展示 案例2: 萝莉
语
音
克隆-5款模型
语
音
克隆-带数字文本-效果展示 案例3: 萝莉
语
音
克隆
语音克隆
开源模型
教程
Suno
音
乐新手指南(手把手完整版教程)
多
语
言、多人物混合演唱的时候,歌词标记可能会非常复杂,建议大家一起琢磨。
suno
歌曲
教程
AI拟声: 5秒内克隆您的声
音
个性化
语
音
助手:使用MockingBird,你可以创建自己的个性化
语
音
助手。
声音克隆
开源
Python
Python入门与
语
法速查
特别是人工智能的火热,再加之它的
语
法简洁且优美,实乃初学者入门AI必备的编程
语
言。
python
编程
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
,用于改善人类与大型
语
言模型的自然
语
音
交互。
asr
tts
声音
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多
语
言检索效果超过微软跟openai
从实验结果上看,在多
语
言跟跨
语
种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text
BGE
M3-Embedding
多语音检索
视频
Prompt | 抖
音
视频脚本
复制脚本并访问 https://beta.elevenlabs.io/speech-synthesis 以生成文本转
语
音
。
prompt
Meta
各个
语
种互相翻译:Meta推出NLLB-200 AI模型,可实现200种
语
言互译
这其中,中文分为简体繁体和粤
语
三种,而除了中英法日
语
等常用
语
种外,还包括了许多小众
语
言。
翻译
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100