首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语
音
交互大模型
它在语
音
合成方面表现卓越,利用先进的深度学习技术,实现了高质量的语
音
输出,其发
音
精准、流畅自然,仿佛真人发
声
。
Westlake
-
Omni
语音
Roop参数说明,ROOP->StyleGAN演示!
肯定是“马赛
克
”画质。
视频
StyleGAN
ComfyUI
ComfyUI安装及生成第一张图
/install.sh)" 2、安装一些需要的包 打开一个新终端并运行以下命令 brew install cmake protobuf rust python@3.10 git wget 3、
克
隆
ComfyUI
文生图
工具
做自媒体消息闭塞很致命,巨好用的工具分享
文案、脚本辅助创作 量子探险:最近发现的宝藏AI,主打长文本,很适合用来写长脚本、写小说 豆包:字节旗下AI,功能很全,甚至还能根据需求生成图片和
音
乐,目前是免费滴
自媒体
工具
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/
音
频/文本
作者的
音
频涵盖44种
音
色,确保
音
色丰富多样。
Baichuan-Omni
多模态大模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
低调的PDF,为什么成了数字文档“永远的神”?
尽管PostScript的页面描述效率已经非常高,但还是远远超出当时个人电脑的硬件能力范围,因此沃诺
克
和格施
克
最初将PostScript的服务对象定位在大型印刷工作站,直到乔布斯适时的出现
工作
小度为何押注AI眼镜?
李莹表示,AI眼镜作为人类的第一视角设备,可以捕捉视觉、
声
音
、位置等多个维度的信息,将重新定义人与世界的互动方式。
AI眼镜
小度
AI Comic Factory:AI(连环)漫画生成器
我还没有为它编写文档,但基本上它是其他现有 API 的“只是一个包装器™”: @hysts 的 hysts/SD-XL 空间 以及其他用于制作视频、添加
音
频等的 API
生成式AI
工具
HAI-Chat:高效且轻量的一键式 RLHF 训练工具
步骤一:有监督微调 有监督微调(Supervised Fine-Tuning,简称 SFT),又被称为行为
克
隆
(Behavioral Cloning,简称 BC),是 RLHF 训练过程中的一个重要步骤
HAI-Chat
RLHF
「语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
SDXL
【分享】SDXL模型最佳拍档!COMFY UI上手指南
您可以按照以下步骤操作:进入命令行模式,在COMFY目录中输入指令,然后
克
隆
插件管理器。
大模型
Mixtral 7B 官宣免费,一大波 AI 模型也免费了,有网就能用!
如果你想要体验九月份发布的 Mixtral 7B 模型,也可以点击网页上的“
克
隆
并修改”按钮,重新指定当前应用的 AI 模型。
开源
大模型
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
它通过先进的
音
频到3D网格映射技术和网格到视频的转换技术,实现了高质量、逼真的
音
频驱动的说话头像视频生成。
VividTalk
视频
SDXL
SDXL Styles:七十七种绘画风格任你选择
通过在UI界面上简单的选择,我们就可以生成多种多样的风格图片,如动漫、水彩、平面、3D、线稿、涂鸦、剪纸、朋
克
、童话等等。
文生图
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100