首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转
换
为视频。
AnimateDiff
视频
训练
Stable Diffusion
小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
扩展地址:https://github.com/thisjam/sd-webui-oldsix-prompt 3.After Detailer人
脸
及手部修复插件 推荐指数:⭐
SD
插件
文生图
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
openpose有6个预处理器,一个openpose ,openpose face姿态和
脸
部,openpose faceonly仅
脸
部,openpose full姿态手部
脸
部,openpose hand
Stable
Diffusion
文生图
controlnet
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
它通过先进的音频到3D网格映射技术和网格到视频的转
换
技术,实现了高质量、逼真的音频驱动的说话头像视频生成。
VividTalk
视频
腾讯
腾讯最新的人像写真工作PhotoMaker
用随机噪声填充了身体部分和背景,为了消除非
脸
部的图像区域影响。
PhotoMaker
文生图
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,
换
句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-Speech)技术是一项可以将文本转
换
成语音的技术。
TTS
Maker
语音
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
例如,可以通过简单地替
换
类词来定制人类ID的年龄和性别。
PhotoMaker
文生图
ComfyUI
用秋叶启动器安装fooocus,comfyui
秋叶启动器的好处就是非常方便的切
换
环境以及版本号 如果你本来就有comfyui或者其他ui怎么办呢?
ComfyUI安装
ComfyUI
ComfyUI进阶前必备插件们续
ComfyUI界面汉化 (消除语言障碍先,不行咱还能来回切
换
) 2.
ComfyUI
文生图
StableDiffusion
StableDiffusion模型推荐系列(全能型)
今天,我们要聊一聊AI绘画领域里的一个超有趣的话题:为什么Midjourney能用一个5.2模型轻松驾驭各种风格,而Stable Diffusion却需要我们切
换
无数个模型呢?
stablediffusion
sd
文生图
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
对图像中的人
脸
进行检测并返回人
脸
坐标位置 face-recognition 人
脸
识别 对图像中的人
脸
进行检测并返回人
脸
坐标位置
开源
Python
Python状态机:优雅处理复杂业务逻辑的利器
在软件开发中,我们经常需要处理对象在不同状态之间的转
换
。
Python状态机
设计模式
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
想将一份文档图片转
换
成 Markdown 格式?
OCR
手写
文字识别
数据库
颠覆数据存储方式:向量数据库的威力
向量数据库通过计算向量之间的相似度来搜索数据,因此它特别适用于人
脸
识别、语音识别、推荐系统等需要高维度数据处理的领域。
编程
数据库
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100