首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· AI声音克隆 | 最全最简教程(权威版)
· Stable Diffusion|提示词高阶用法(二)双人同图
· DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
· 80多个罕见的论文prompt,让你起飞!
· 14.4K Star,一款漂亮、快速、现代化的开源免费UI组件库
· 达摩院SPACE对话大模型:知识注入与知识利用
· 大模型微调应用实践,没那么简单,看看曾经踩过的坑
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音频生成开发框架
在过去的几年里,我们看到了AI在
图
像、
视
频和文本生成方面的巨大进步。
开源模型
开源
令人惊艳的开源
图
标生成AI模型:ChartLlama (南洋理&腾讯)
制作
图
表是一件既费时又费力的事情,需要掌握各种软件和技巧 那么,能否使用AI大语言模型来生成
图
标呢?
ChartLlama
开源模型
图标
Sora
快手版Sora「可灵」开放测试:生成超120s
视
频,更懂物理,复杂运动也能精准建模
原生的
视
频生成技术路线 整体上,可灵大模型的采用了原生的文生
视
频技术路线,替代了
图
像生成+时序模块的组合,这也是可灵生成时间长、帧率高,能准确处理复杂运动的核心奥义。
可灵
快手
文生视频
Sora
Sora懂不懂物理世界?
丘成桐先生的弟子, 计算机
图
形学专家顾险峰从数学角度给出了很精到的分析:https://mp.weixin.qq.com/s/IUN1Y6TDATtFOK9r8m8iUQ 顾险峰老师在文中列举了Sora
文生视频
视频生成
sora
OmniVision - 968M:小巧精悍的
视
觉语言模型,释放多模态边缘计算强大潜能
视
觉编码器Siglip - 400m则专注于
图
像信息的处理,以384分辨率和14×14的块大小生成
图
像嵌入,将
图
像转换为模型可理解的向量表示。
OmniVision
-
968M
多模态模型
Stable Diffusion
Stable Diffusion快速生
图
,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
SDXL-Turbo 基于一种称为对抗扩散蒸馏 (ADD) 的新颖训练方法,该方法允许在高
图
像质量下以 1 到 4 个步骤对大规模基础
图
像扩散模型进行采样。
sdxl
SD
绘画
大模型
字节推出开源绘画大模型SDXL-Lightning,秒级出
图
相较于其他SDXL大模型,SDXL-Lightning最显著的优点在于可一步生成
图
像。
sdxl
字节
绘画
再也不怕合照缺人,Anydoor为
图
片编辑开了一道「任意门」
为了使定制对象生成泛化性更强,作者从
视
频中收集了同一对象的
图
像对,方便模型学习生成对象的外观变化。
Anydoor
文生图
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测
图
像或
视
频中的人体关键点,并且能够识别不同的身体部位和动作。
行为识别
姿态识别
工具
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI
视
频、AI语音...
涵盖了 AI 绘画、AI
视
频、AI 音乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
盘古
华为盘古画画3.0发布 | PanGu-Draw:业界最大的中文文生
图
模型,效果YYDS!
相反,作者将高分辨率
图
像与升级后的低分辨率
图
像集成在一起。
PanGu-Draw
文生图
一张照片秒生不同风格
图
像!小红书InstantID来了!
最近腾讯的PhotoMaker很火,因为仅需要一张大头照就可以快速实现类似妙鸭相机的效果,现在又有一个类似的解决方案InstantID出现了,它能够在保持高保真度的同时,仅使用一张面部
图
像实现个性化
图
像合成
InstantID
文生图
腾讯
阿里腾讯豪华阵容参投,智谱AI投资版
图
曝光
清华朋友圈 智谱的投资版
图
几乎就是一个清华朋友圈。
智谱
阿里
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和
图
片OCR)
然后软件会在
图
像上添加一个带有实际文本的
图
层,这样你就可以在浏览文件时选择它作为一个单独的组件。
大语言模型
python
Stable Diffusion
张嘴就能生
图
?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
https://youtu.be/adDyTzBdUcg 其生
图
的速度远远超过了传统生成的速度,都什么年代还在边等
图
边打星穹铁道?
SDXL-Turbo
文生图
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100