首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI绘画:InstantID Win11本地安装记录!
Windows11+Conda+git 1.
克
隆
代码 打开CMD工具,通过CD命令进入到指定目录,然后
克
隆
代码。
InstantID
Win11
安装
Meta
各个
语
种互相翻译:Meta推出NLLB-200 AI模型,可实现200种
语
言互译
这其中,中文分为简体繁体和粤
语
三种,而除了中英法日
语
等常用
语
种外,还包括了许多小众
语
言。
翻译
大模型
Stable Diffusion
详解Stable Diffusion提示词prompt
语
法
详解Stable Diffusion提示词prompt语法
SD
prompt
文生图
提示词
【进阶】-文生图术
语
解释
黑话# 缩写/术
语
解释 oneshot 一张图
文生图
开源
6个最佳开源TTS引擎
TTS引擎用于实现文本到
语
音
的转换。
TTS引擎
开源模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
其实歌声转换不仅仅适用于歌声,普通讲话也可以,只是歌唱的
音
调基本能覆盖到低、中、高全域声
音
类型,而正常说话可能无法做到全域覆盖,但是如果在录制声
音
的时候能够做到覆盖多种
音
调类型,也可以实现声
音
转换。
声音
sovits
开源
开源大
语
言模型完整列表
Large Language Model (LLM) 即大规模
语
言模型,是一种基于深度学习的自然
语
言处理模型,它能够学习到自然
语
言的
语
法和
语
义,从而可以生成人类可读的文本。
开源模型
大语言模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程!
其实歌声转换不仅仅适用于歌声,普通讲话也可以,只是歌唱的
音
调基本能覆盖到低、中、高全域声
音
类型,而正常说话可能无法做到全域覆盖,但是如果在录制声
音
的时候能够做到覆盖多种
音
调类型,也可以实现声
音
转换。
so-vits-svc
音色转换
教程
RAG
RAG 2.0来了,它能成为生产落地的福
音
吗?
在典型的RAG系统中,通常会采用现成的通用嵌入模型来实现数据的嵌入处理,利用向量数据库进行高效的信息检索,并结合大型的黑盒
语
言模型来完成内容的生成。
RAG
大模型
人工智能
6个AI
音
乐软件推荐,让你学会人工智能AI作曲
在当下的应用中,AI已经可以影响
音
乐制作过程的各个方面,包括
音
乐生成、
音
频掌握等。
训练
音乐
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
learning for end-to-end Text-to-Speech)是一种结合变分推理(variational inference)、标准化流(normalizing flows)和对抗训练的高表现力
语
音
合成模型
音乐
AGI
通往 AGI 之路:走进大
语
言模型
这篇文章就带你从三个方面认识目前最火热的大
语
言模型 ChatGPT。
AGI
ChatGPT
大语言模型
开源
ChatGLM3-6B:新一代开源双
语
对话
语
言模型,流畅对话与低部署门槛再升级
在
语
义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。
ChatGLM3
语音模型
开源模型
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献
语
义检索
语
义索引能够较好地表征
语
义信息,解决字面不相似但
语
义相似的情形。
开源模型
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100