文章列表-AI魔法学院

文章列表

再也不怕合照缺人，Anydoor为图片编辑开了一道「任意门」

为了做到这一点，作者的核心思想是用身份和细节高度相关的特征来表示目标对象，然后将它们组合到与背景场景的交互之中。

Anydoor 文生图

大语言模型定制化应用的三种方式：Prompt engineering、Fine tuning、Pre-trainning的区别

这种方法适用于特定任务的应用，需要模型具备高度适应性和精度。

大模型

微调、训练大模型概念介绍及论文笔记：Tuning系列论文笔记

Tuning整体介绍微调（Fine-tunning）语言模型的参数需要一起参与梯度更新轻量微调（lightweight fine-tunning）冻结了大部分预训练参数，仅添加任务层，语言模型层参数不变

训练微调

如何最简单、通俗地理解Transformer？

对于很多领域，ChatGPT所掌握的知识深度都超过了一个本科生（甚至更高）的水平。

Transformer 大模型

数字人：从科幻走向现实的技术革命

这使得数字人能够展现出与真人一样的动作和表情，增加了其真实感和可信度。

数字人语音

体验了几款AI工具&&最新出现的跟数字人相关的几款大模型

头像图片生成高精度的3D头像 Gaussian Head Avatar: https://yuelangx.github.io/gaussianheadavatar/ 3.

数字人大模型文生图

Stable Diffusion

【Stable Diffusion操作入门】Stable Diffusion 操作界面及基础参数介绍

输出分辨率（宽度和高度）图片分辨率非常重要，直接决定了你的图片内容的构成和细节的质量。

文生图 SD

Stable Diffusion

Stable Diffusion 文生图全网最细详解

Kaggle 搭建的SD，那么你进入到 web ui 页面后可以看到下面这个页面其中：模型选择：模型对于 SD 绘图来说非常重要，不同的模型类型、质量会很大程度的决定最终的出图效果

文生图 SD

GPU 性能（数据表）快速参考

o FP代表浮点运算数据格式，包括双精度（FP64）、单精度（FP32）、半精度（FP16）以及FP8等，INT代表整数格式，包括INT8、INT4等。

GPU 算力

ChatGPT论文润色进阶指令

深度分析与评估指令：请帮我深入分析研究方法和数据，并提供优缺点评估。

ChatGPT 写作

图解 transformer——逐层介绍

位置编码的计算是独立于输入序列的，是固定值，只取决于序列的最大长度。

Transformer 大模型图解

微软研究团队：Sora核心技术及未来机会研究报告-中英对照版

随后，序列会被填充词元补齐，以满足批处理操作所需的固定序列长度。

sora 论文

SD入门教程四：图生图基础用法

缩放模式这里的缩放模式是调整图片尺寸大小，常用“剪裁后缩放”，与界面上的3号区域搭配使用的，先调整3号区域内的宽度和高度，再调整4号区域的重绘幅度，2号区域的迭代步数和采样方法默认即可

SD 入门图生图

LLM大模型推理输出生成方式总结

(no_repeat_ngram_size=6即代表:6-gram不出现2次) 限制采样Trick Temperature 方式：通过温度，控制每个字的概率分布曲线。

大模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15的推理速度，显著优于当前基于扩散的TTS模型。

F5-TTS 音频克隆

<...35 36 37 383940 41 42 43 44 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2024 AI魔法学院

京ICP备20027199号-1