首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion快速生
图
,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
SDXL-Turbo 基于一种称为对抗扩散蒸馏 (ADD) 的新颖训练方法,该方法允许在高
图
像质量下以 1 到 4 个步骤对大规模基础
图
像扩散模型进行采样。
sdxl
SD
绘画
大模型
字节推出开源绘画大模型SDXL-Lightning,秒级出
图
相较于其他SDXL大模型,SDXL-Lightning最显著的优点在于
可
一步生成
图
像。
sdxl
字节
绘画
阿里
阿里&字节发表VividTalk,只需单张照片即
可
根据音频生成栩栩如生的人物说话头像视频
方法 本文介绍了一种方法,
可
以根据音频序列和参考面部
图
像生成具有多样化面部表情和自然头部姿势的说话头像视频。
VividTalk
视频
再也不怕合照缺人,Anydoor为
图
片编辑开了一道「任意门」
把野餐布上的另一只小熊换成这只鞋,再给它做个镜像效果,画个框,就
可
以静待魔法生成了。
Anydoor
文生图
盘古
华为盘古画画3.0发布 | PanGu-Draw:业界最大的中文文生
图
模型,效果YYDS!
· · PanGu-Draw (5B模型)
可
以生成与文本和各种控件对齐的高质量
图
像,提高了基于扩散的
图
像生成的
可
扩展性和灵活性。
PanGu-Draw
文生图
提示词
18种 DALL-E 3 炫酷的文字效果和提示词
在
图
片上添加文字不仅
可
以传达信息,还
可
以吸引观众的注意力。
DALL-E
3
提示词
文生图
语音
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即
可
在本地安装
它们在交互性方面
可
能会遇到困难,或者存在延迟问题。
GLM-4-Voice
9B
语音
安装
大模型
OCR终结了?旷视提出
可
以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
: 又或是手机页面截
图
: 甚至
可
以将
图
片中的表格转换成 Latex 格式: 当然,作为多模大模型,通用能力的保持也是必须的: Vary 表现出了很大的潜力和极高的上限,OCR
可
以不再需要冗长的
OCR
手写
文字识别
一张照片秒生不同风格
图
像!小红书InstantID来了!
最近腾讯的PhotoMaker很火,因为仅需要一张大头照就
可
以快速实现类似妙鸭相机的效果,现在又有一个类似的解决方案InstantID出现了,它能够在保持高保真度的同时,仅使用一张面部
图
像实现个性化
图
像合成
InstantID
文生图
腾讯
阿里腾讯豪华阵容参投,智谱AI投资版
图
曝光
尽管有不同的测算口径,但智谱的估值早已超过10亿美元的门槛,有不少分析认为甚至有
可
能上看150亿人民币,考虑到今年三个季度的融资总额达到25亿,这个数字并没有夸张。
智谱
阿里
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和
图
片OCR)
这种类型的文件
可
以包含各种组件,例如
图
像、文本和链接,这些组件都是
可
以被选中、搜索和易于编辑的。
大语言模型
python
Stable Diffusion
张嘴就能生
图
?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
https://youtu.be/adDyTzBdUcg 其生
图
的速度远远超过了传统生成的速度,都什么年代还在边等
图
边打星穹铁道?
SDXL-Turbo
文生图
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,
可
以提高RAG性能
但有时嵌入/检索大的文本块
可
能会感觉不太理想。
RAG
检索
Stable Diffusion
超详细的 Stable Diffusion ComfyUI 基础教程(二):文生
图
基础流程
Checkpoint Loader,这是我们上节课安装的 ComfyUI-Custom-Scripts 插件中的加载器,
可
以用来预览缩略
图
)。
comfyui
文生图
用户意
图
对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B
该研究目标是创建一个与用户意
图
更符合的小型语言模型。
小型语言模型
Zephyr-7B
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100