文章列表-AI魔法学院

文章列表

ComfyUI进阶前必备插件们续

先推荐一个Github page，它就帮我们收录了很多好用的插件： https://github.com/WASasquatch/comfyui-plugins · &ensp

ComfyUI 文生图

各个语种互相翻译：Meta推出NLLB-200 AI模型，可实现200种语言互译

开源地址：GitHub - facebookresearch/fairseq at nllb https://github.com/facebookresearch/fairseq/tree/nllb

翻译大模型

Stable Diffusion

Stable Diffusion ComfyUI 入门感受

github.com/comfyanonymous/ComfyUIgithub.com/comfyanonymous/ComfyUI 基础配置：下载：首先从官方的github

文生图

ComfyUI学习笔记：插件安装

即插件）安装缺失的custom node（稍后讲）安装模型 Install Custom Nodes 点击 Install Custom Nodes后，会去github

comfyui 插件绘画

「语音识别的未来已来」——探索Distil-Whisper，轻量级AI的强大力量

https://arxiv.org/pdf/2311.00430.pdf 项目实践：若想实际操作Distil-Whisper，可以通过项目地址访问其GitHub

Distil-Whisper 语音识别

扣子更新图像流功能，字节版 ComfyUI 来了！

在介绍扣子的图像流之前，有必要先讲讲 ComfyUI.ComfyUI 是一个爆火的开源项目，目前在 Github 上拥有 34k+ stars.

ComfyUI 图像流文生图

ComfyUI安装教程

安装 GitHub上的README文件 https://github.com/comfyanonymous/ComfyUI#installing 下载模型如果你对稳定扩散相关的内容完全不了解，

ComfyUI安装

一个令人惊艳的图片高清化重绘神器：SUPIR来了！

部署安装这个项目发布在Github上：https://github.com/Fanghua-Yu/SUPIR 你可以参照其中的介绍自行安装，不过坑可能比较多，还有很多模型需要特殊网络设置才能下载，

SUPIR 文生图

惊艳推荐！8款好用又免费的文本转语音TTS工具

获取和使用作为一个开源项目，TensorFlowTTS可以通过GitHub获得。

TTS Maker 语音

RAG超参数调优食用指南

有关如何生成数据集的详细信息，可以参阅 LlamaIndex GitHub主页的 DatasetGenerator 模块。

rag 大模型

爆火「视频版ControlNet」开源了！靠提示词精准换画风，全华人团队出品

目前，团队已将这一方法在GitHub上开源。

ControlNet

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

sft_粤语女代码合成,z先生的备忘录,23秒声音克隆案例展示: 对CosyVoice-300M模型零样本推理生成音频效果展示首先我们准备音频素材，来自于CosyVoice-300M的github

asr tts 声音

Stable Diffusion

Stable Diffusion｜提示词高阶用法（四）LoRA指定区域

感兴趣的朋友可以自行在B站或GitHub上查看相关的技术分享。

文生图

换脸软件 FaceFusion 保姆级教程

在操作之前，需要加一个配置，不能访问不了 github 这些站在终端输入命令 · source /etc/network_turbo 参考

FaceFusion 教程

TrOCR——基于transformer模型的OCR手写文字识别

像预训练阶段模型一样，IAM 手写模型和SROIE 打印数据集模型也分别包含三个维度的模型：使用TrOCR 来进行图片文字识别，我们可以直接使用GitHub开源代码来实现

OCR 手写文字识别

<...6 7 8 91011 12 13 14 15 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1