首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· OCR的终极解法——传统算法VS多模态大模型
· 超级干货,自学stable diffusion,看完这篇就够了
· Suno音乐新手指南(手把手完整版教程)
· 语音克隆又又又又又升级了
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 深入探秘:百川7B大模型的训练代码解析,揭秘巨无霸语言模型背后的奥秘
· ChatGPT羊驼家族全沦陷!CMU博士击破LLM护栏,人类毁灭计划脱口而出
· 了解Kimi必看的26个问题 | Kimi系列文(二)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
硬核解读Stable Diffusion(系列一)
latent空间,然后用扩散模型来生成图
像
的latents,最后送入autoencoder的decoder模块就可以得到生成的图
像
。
StableDiffusion
文生图
数据库
颠覆数据存储方式:向量数据库的威力
[0.12, 0.32, -0.5] 在计算机视觉中,图
像
可以通过一组数值(即
像
素值)表示,这组数值构成一个向量。
编程
数据库
换脸
AI换脸工具:facefusion使用心得
frame_enhancer: 提升整个帧的图
像
质量。
FaceFusion
文生图
换脸
一键AI换脸!小红书和北大合作的InstantID
这个模块通过解耦的交叉注意力机制,使得图
像
和文本能够独立地影响生成过程,从而在保持身份信息的同时,允许用户对图
像
风格进行精细控制,实现「双赢」。
InstantID
文生图
人工智能
医疗+人工智能的创新应用
AI+医疗产业链上游为仪器产商包括影
像
设备厂商、医疗机器人厂商。
大模型
如何用大语言模型构建一个知识问答系统
这里提供一个 python 库textract[12],支持从多种类型文件中提取文字信息,普通文本文件自不必说,其它各种常用格式文件也都支持,比如:Microsoft 全家桶 docx, xlsx;图
像
知识库
大模型
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
便可迅速进行专利审查工作并给出风险分析: · 核工业首个多模态 AI 讲师书锦,通过文字、图
像
、
宁德核电
大模型
大模型
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
从几万字到几十万字,
头
部创业公司都在抢滩「长窗口」 如果你关注大模型在文本理解方向的应用,或许会注意到一个现象:一开始,大家用来测评模型能力的文本可能都是一些财报、技术报告,这些文本通常有十几页到几十页不等
Baichuan2
百川
开源
Stable Diffusion
超详细的 Stable Diffusion ComfyUI 基础教程(二):文生图基础流程
是不是有大模型、正向提示词、反面提示词、采样器、步数、宽高、VAE、显示图
像
。
comfyui
文生图
ComfyUI
ComfyUI学习笔记2,一文看透Workflow
上图,从最左边加载模型开始,经过中间的CLIP Text Encode对关键词Prompt做处理,加入一个初始的Latent Image,然后是采样器,VAE解码,最后得到生成的图
像
。
comfyui
文生图
ChatGPT
麦肯锡专家都在用的方法:用ChatGPT速览用户研究领域的 50 个核心概念
这个过程就
像
在绘制现实生活中的同理心地图。
用户
工作
人工智能
人工智能的应用范式呼之欲出
Bloomberg-GPT、法律领域的ChatLaw、医疗领域的Med-PaLM 和自然科学研究领域的DARWIN等垂直领域大模型都是类似的思路:历史积累丰富垂直行业数据经过清洗标注后形成知识库,在大模型基座上从
头
进行训练
大模型
Prompt
Prompt 策略:代码库 AI 助手的语义化搜索设计
这些助手能够回答关于代码库的问题、提供文档、搜索代码、识别错误源
头
、减少代码重复等,从而提高开发效率、降低错误率,并减轻开发者的工作负担。
prompt
Fastwhisper + Pyannote 实现 ASR + 说话者识别
//modelscope.cn/models/manyeyes/speaker_recognition_task_models_onnx_collection/files下载,下载wespeaker开
头
的
faster-whisper
语者识别
ASR
新模型Cascade你真的用对了吗?!
而Stable Cascade 的压缩系数为 42,这意味着可以将 1024x1024 图
像
,在潜空间的编码为 24x24,这样就可以使用更小的潜空间尺寸,并且实现清晰的图
像
输出。
Stable
Cascade
模型
<
...
40
41
42
43
44
45
46
47
48
49
...
>
1
2
4
5
6
7
8
9
100