首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 读取大脑重建高清视频,Stable Diffusion还能这么用
· AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
· 百度智能云的Prompt模板
· stable diffusion API 调用,超级详细代码示例和说明
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 产品运营全流程SOP
· 测评了8个国产AI大模型,差点崩溃……
· 阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 国产视频制作之光-可灵:提示词大全整理
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
构建开源
多
模态RAG系统
在这个新的冒险中,我们将深入研究使用开源大型
语
言
多
模态(LLMM)构建
检
索
增强型生成(RAG)系统的过程。
RAG
大模型
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有
多
“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、
语
音
转文字
提示词
prompt
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的
语
音
合成,同时支持
多
说话人。
chattts
tts
文生语音
Sora
OpenAI视频模型Sora的推理生成成本
多
高?
(Video Encoder/Decoder 的计算量相比 DiT 可以忽略不计) Sora 的模型
多
大呢?
Sora
推理
算力
大模型
大模型再发展5年,搜
索
引擎还在么?
可以想象一个极端情况,就是全网50%的内容都和一个人工智能生成的内容发生链接,那按照搜
索
的机制,无疑的这是应该被排到前面的,而则可能是不对的,它不一定质量很好,而只可能是被用其它模型生成内容用的
多
。
大模型
开源
QAnything:网易有道最新开源的“本地化部署知识库”AI问答系统
·跨
语
言问答支持,可以在中英文问答之间自由切换,不受文档
语
言的限制。
网易
RAG
知识库
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换成
语
音
的AI工具。
TTS
文本转语音
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
ChatGLM
chatglm3基础模型
多
轮对话微调
user、assistant、换行等特殊token SFT的方式 假设SFT的数据为 Q1,A1,Q2,A2,Q3,A3 SFT的过程只会计算 A1,A2,A3 的loss,且一次推理会同时计算
多
轮对话的
ChatGLM
微调
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
作为实验室任务参与者的LLM 人工智能心理学家们正在深入探
索
LLM的心理学特质,他们的研究揭示了LLM与人类认知机制在
多
大程度上存在差异和相似性。
大语音模型
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过约70万小时的
多
语
种数据训练,实现了接近人类水平的
语
音
合成效果,目前已更新到1.4版本。
Fish
Speech
本地搭建
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
最近在搞克隆人,发现一个很好的声
音
克隆项目,测试了一下,效果真不错,可以直接用,也可以微调后使用,好了废话不
多
说,直接上干活,哈哈~~ &ensp
数字人
声音克隆
GPT-SoVITS
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
开源:F5-TTS的代码和
检
查点被开源,以促进社区发展。
语音克隆
开源模型
被高估的Pika,被低估的
多
模态AI
在行业主
语
为“落地”的当下,
多
模态 AI 正走向场景化、实用化、商业化。
大模型
多模态
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100