首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
Falcon 180B 开源影响了谁?
而每一次大参数模型开源都会在社
区
中引起一阵狂欢,因为这无疑壮大了整个开源社
区
,给整个大模型开源注入一股更大的力量。
大模型
Stable Diffusion
Stable Diffusion 抽卡必备神器!Agent Scheduler
相信大家在玩 Stable Diffusion 的时候一直有一个痛点,每次出图抽卡时都只能等待上一次抽卡结束,才能继续下一次抽卡; 特
别
是当我们想抽大量的卡来测试不同的模型,不同的参数的效果时,那么是非常奔溃的
Agent
Scheduler
Stable
Diffusion
写作
一个写了会上瘾的公众号写作模板
现在还是有很多人想要学写作,但是又不知道如何下手的情况,想起最开始接触写作的时候,总是会在各大平台上搜索那些写作的模板、写作的结构,这种之类的干货知识,但是,能够坚持写作的模板其实并没有那么的华丽,反而特
别
的简单
公众号
写作模版
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
与依赖连续音频流的传统语音识
别
系统不同,我们使用语音活动检测(VAD)来检测语音的存在,并且仅在检测到语音时才发送音频数据以耳语。
OpenAI
Whisper
大模型
Midjourney
10大Midjourney描述词网站,让你Ai创作随心所欲!
为了让大家提高工作效率,本期将给大家推荐一些灵活高效Midjourney关键词网站,这样各位就可以直接参考
别
人的AI关键词进行创作了,听起来是不是很棒棒啊!
描述词
文生图
ChatGPT
万字长文|40万人学习过|28个ChatGPT使用技巧,带你从入门到精通
的GPT-4模型已经进化成GPT-4-turbo,有了更强的上下文理解能力,更长的文本记忆,能理解图片、生成图片,以及更会使用网页浏览、代码解释器等工具帮助用户完成任务,所以我预期会在2024年1月分
别
在我的
ChatGPT
使用技巧
教程
GPTs
智能时代的变革者:定制化GPTs重塑未来的五大预言
特定群体的支持: 特
别
是对于低收入和边远地
区
的人们,提供定制化的教育和培训资源至关重要。
GPTs
智能
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
对于所提出的PhotoMaker,首先分
别
从文本编码器和图像编码器中获得文本嵌入和图像嵌入。
PhotoMaker
文生图
再也不用担心 AI 图片脸崩手崩了
没关系,让我来为大家讲解它们的
区
别
。
ADetailer
安装
文生图
工具
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
除此之外,还有一些小细节的功能,修改个年龄、性
别
以及照片年代啥的。
PhotoMaker
图生图
换脸
Roop升级版FaceFusion换脸AI技术使用以及部署教程
SOURCE 上传图像
区
域 TARGET 上传视频
区
域 OUTPUT VIDEO ENCODER(输出视频编码器)
FaceFusion
教程
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
我们的方法使用混合形状和顶点作为中间表示,分
别
建模粗略运动和细粒度运动,以生成唇同步和逼真的说话头视频。
VividTalk
视频
大模型
【全文翻译】微软166页论文解读 GPT-4V:多模态大模型的黎明
论文摘要 大型多模态模型(LMMs)通过多感官技能,如视觉理解,来扩展大型语言模型(LLMs),以实现更强的通用智能(注意 LMMs 与 LLMs的
区
别
)。
多模态大模型
GPT-4V
文生图
Sora
Sora懂不懂物理世界?
局部合理与整体荒谬 Sora可以合理拼接相邻令牌,但整体视频可能出现悖谬,缺乏全局的合理性:观察下面的“幽灵椅子”视频:如果我们将视野限制在屏幕中间的一个局部
区
域,则视频非常合理。
文生视频
视频生成
sora
Stable Diffusion
造梦师手记:腾讯加入Stable Diffusion的ControlNet模型开发,效果艳丽
两套模型有什么
区
别
吗?
Stable
Diffusion
<
...
10
11
12
13
14
15
16
17
18
19
...
>
1
2
4
5
6
7
8
9
100