文章列表-AI魔法学院

文章列表

动画制作工具AnimateDiff用法详解

AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。

AnimateDiff 视频训练

Stable Diffusion

小白设计师福音：Stable Diffusion 16款插件测评，好用不？推荐吗？

扩展地址：https://github.com/thisjam/sd-webui-oldsix-prompt 3.After Detailer人脸及手部修复插件推荐指数：⭐

SD 插件文生图

Stable Diffusion

stable diffusion最全18种controlnet模型，详细教程讲解。

openpose有6个预处理器，一个openpose ,openpose face姿态和脸部，openpose faceonly仅脸部，openpose full姿态手部脸部，openpose hand

Stable Diffusion 文生图 controlnet

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

它通过先进的音频到3D网格映射技术和网格到视频的转换技术，实现了高质量、逼真的音频驱动的说话头像视频生成。

VividTalk 视频

腾讯最新的人像写真工作PhotoMaker

用随机噪声填充了身体部分和背景，为了消除非脸部的图像区域影响。

PhotoMaker 文生图

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过

Whisper 语音优化

惊艳推荐！8款好用又免费的文本转语音TTS工具

TTS（Text-to-Speech）技术是一项可以将文本转换成语音的技术。

TTS Maker 语音

爆火！腾讯开源PhotoMaker：高效地定制化生成任意风格的逼真人类照片！

例如，可以通过简单地替换类词来定制人类ID的年龄和性别。

PhotoMaker 文生图

用秋叶启动器安装fooocus，comfyui

秋叶启动器的好处就是非常方便的切换环境以及版本号如果你本来就有comfyui或者其他ui怎么办呢？

ComfyUI安装

ComfyUI进阶前必备插件们续

ComfyUI界面汉化（消除语言障碍先，不行咱还能来回切换） 2.

ComfyUI 文生图

StableDiffusion

StableDiffusion模型推荐系列（全能型）

今天，我们要聊一聊AI绘画领域里的一个超有趣的话题：为什么Midjourney能用一个5.2模型轻松驾驭各种风格，而Stable Diffusion却需要我们切换无数个模型呢？

stablediffusion sd 文生图

ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

对图像中的人脸进行检测并返回人脸坐标位置 face-recognition 人脸识别对图像中的人脸进行检测并返回人脸坐标位置

开源

Python状态机：优雅处理复杂业务逻辑的利器

在软件开发中，我们经常需要处理对象在不同状态之间的转换。

Python状态机设计模式

OCR终结了？旷视提出可以文档级OCR的多模态大模型框架Vary，支持中英文，已开源！

想将一份文档图片转换成 Markdown 格式？

OCR 手写文字识别

颠覆数据存储方式：向量数据库的威力

向量数据库通过计算向量之间的相似度来搜索数据，因此它特别适用于人脸识别、语音识别、推荐系统等需要高维度数据处理的领域。

编程数据库

<...3 4 5 678 9 10 11 12 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1