首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· 嘴里塞饭型Stable Diffusion提示词写法实用小笔记
· GPT提示词必杀技:思维树法
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 图解检索增强式生成(RAG)技术 | 万字长文
· 十大开源语音识别项目
· EverydayWechat:让微信变得更强大,引领每日生活新体验
· 主流网络爬虫蜘蛛详解
· 挑战全网,字节跳动coze平台让你免费创建ChatGPT4的机器人,不仅能免费使用DallE3,还能免费导入自己的知识库
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
为了做到这一点,作者的核心思想是用身份和细节高
度
相关的特征来表示目标对象,然后将它们组合到与背景场景的交互之中。
Anydoor
文生图
Prompt
大语言模型定制化应用的三种方式:Prompt engineering、Fine tuning、Pre-trainning的区别
这种方法适用于特定任务的应用,需要模型具备高
度
适应性和精
度
。
大模型
大模型
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
Tuning整体介绍 微调(Fine-tunning) 语言模型的参数需要一起参与梯
度
更新 轻量微调(lightweight fine-tunning) 冻结了大部分预训练参数,仅添加任务层,语言模型层参数不变
训练
微调
Transformer
如何最简单、通俗地理解Transformer?
对于很多领域,ChatGPT所掌握的知识深
度
都超过了一个本科生(甚至更高)的水平。
Transformer
大模型
数字人
数字人:从科幻走向现实的技术革命
这使得数字人能够展现出与真人一样的动作和表情,增加了其真实感和可信
度
。
数字人
语音
大模型
体验了几款AI工具&&最新出现的跟数字人相关的几款大模型
头像图片生成高精
度
的3D头像 Gaussian Head Avatar: https://yuelangx.github.io/gaussianheadavatar/ 3.
数字人
大模型
文生图
Stable Diffusion
【Stable Diffusion操作入门】Stable Diffusion 操作界面及基础参数介绍
输出分辨率(宽
度
和高
度
) 图片分辨率非常重要,直接决定了你的图片内容的构成和细节的质量。
文生图
SD
Stable Diffusion
Stable Diffusion 文生图全网最细详解
Kaggle 搭建的SD,那么你进入到 web ui 页面后可以看到下面这个页面 其中: 模型选择:模型对于 SD 绘图来说非常重要,不同的模型类型、质量会很大程
度
的决定最终的出图效果
文生图
SD
GPU 性能(数据表)快速参考
o FP代表浮点运算数据格式,包括双精
度
(FP64)、单精
度
(FP32)、半精
度
(FP16)以及FP8等,INT代表整数格式,包括INT8、INT4等。
GPU
算力
ChatGPT
ChatGPT论文润色进阶指令
深
度
分析与评估 指令:请帮我深入分析研究方法和数据,并提供优缺点评估。
ChatGPT
写作
Transformer
图解 transformer——逐层介绍
位置编码的计算是独立于输入序列的,是固定值,只取决于序列的最大长
度
。
Transformer
大模型
图解
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
随后,序列会被填充词元补齐,以满足批处理操作所需的固定序列长
度
。
sora
论文
教程
SD入门教程四:图生图基础用法
缩放模式 这里的缩放模式是调整图片尺寸大小,常用“剪裁后缩放”,与界面上的3号区域搭配使用的,先调整3号区域内的宽
度
和高
度
,再调整4号区域的重绘幅
度
,2号区域的迭代步数和采样方法默认即可
SD
入门
图生图
大模型
LLM大模型推理输出生成方式总结
(no_repeat_ngram_size=6即代表:6-gram不出现2次) 限制采样Trick Temperature 方式:通过温
度
,控制每个字的概率分布曲线。
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15的推理速
度
,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
<
...
35
36
37
38
39
40
41
42
43
44
...
>
1
2
4
5
6
7
8
9
100