首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 2023年人工智能行业总结
· GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
· 各个语种互相翻译:Meta推出NLLB-200 AI模型,可实现200种语言互译
· AI领域的agent是什么意思?
· 「长文」可能是目前最全的LangChain AI资源库之一
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· 它来了!SDXL + ControlNet 终于强强联合!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· 如何将 GPT 幻觉发生率从 20% 以上降低到 2% 以下
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ComfyUI
Fooocus,webui,comfyui
优
缺点
今天主要想讲的其实是三大主流sd ui的
优
缺点 首先fooocus看我公众号的小伙伴应该非常熟悉了,作者就是cn的制作者,也是国人。
Fooocus
webui
comfyui
文生图
教程
AI声
音
克隆 | 最全最简教程(权威版)
一直没有写过关于声
音
克隆的文章,所以这次补上,毕竟这个用的还真是有点多,也为后面更多的个性
化
配
音
做好准备。
声音克隆
教程
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为文本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
ChatGPT
如何使用ChatGPT写出
优
质文章
确定主题和目的 细
化
主题:选择一个具体且明确的主题,例如,“气候变
化
对欧洲农业的影响”而不仅仅是“气候变
化
”。
ChatGPT
写作
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
这种设计的
优
势在于减少了信息在不同模块之间传递时的损失和误差,使模型能够更好地
优
化
全局目标。
Westlake
-
Omni
语音
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
这种技术的应用不仅降低了
音
乐制作的门槛,还为
音
乐爱好者和专业人士提供了新的创作工具,从而推动了
音
乐创作的民主
化
。
suno
音乐
RAG
RAG超参数调
优
食用指南
接下来将用一个完整的使用指南来展示如何对 RAG 进行超参数
优
化
,主要针对块大小和 top-K 两个参数。
rag
大模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性
化
的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
模型压缩:量
化
、剪枝和蒸馏
在移动智能终端品类越发多样的时代,为了让预训练
语
言模型可以顺利部署在算力和存储空间都受限的移动终端,对预训练
语
言模型的压缩是必不可少的。
BERT
语言模型
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
ChatGPT
使用ChatGPT写出
优
质长文、文章
运用多样
化
且深入的段落结构,以吸引并维系读者的兴趣。
ChatGPT
写作
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字
化
时代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同时为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
大模型
大模型量
化
:什么是模型量
化
,如何进行模型量
化
Why:为什么需要模型量
化
随着深度学习(Deep Learning)的发现,其在计算机视觉(Computer Vision, CV)和自然
语
言处理(Natural Language Processing
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100