首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 它来了!SDXL + ControlNet 终于强强联合!
· OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
· 阿里出品自动化视频剪辑工具FunClip!
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 中文开源OCR框架对比及介绍
· SD-WebUI和ComfyUI的局域网访问设置
· ChatGPT
· 主流网络爬虫蜘蛛详解
· 长窗口大战要终结了?谷歌魔改Transformer,推出了“无限注意力”
· “大模型+机器人”的现状和未来,重磅综述报告来了!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
一个万能提问公式,让大模型生成高质量回答
好比一个你不怎么熟悉的
同
事,突然拉你去开会,但是开会前又什么都没和你说,我相信你的脑海里一定是这样的: 但如果你的这个
同
事,在开会前给你写了一个会议文档,详细列出了会议背景、会议目的、需要你在会议前中后做什么等信息
提示词
StableDiffusion
StableDiffusion模型推荐系列(全能型)
再加上一些平台推出激励计划,促使大家大量发布模型,不仅导致了模型的
同
质化,也加剧了硬盘空间的紧张局面。
stablediffusion
sd
文生图
爬虫
强大高效的微信爬虫Wechat_Articles_Spider:快速获取公众号文章的利器
· 多线程支持:该工具支持多线程操作,可以
同
时处理多个公众号,提高了爬取效率。
微信爬虫
Stable Diffusion
张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
Turbo具备了最新的快速扩散蒸馏技术(Adversarial Diffusion Distillation),这个技术可以在保持图像生成质量的
同
时大幅度降低采样步数(生成速度) 比较明显的比对就是
SDXL-Turbo
文生图
提示词
20 个提升您设计水平的DALLE-3提示词
尝试使用Bing Chat 提供的不
同
模式来获得不
同
的结果(创意、平衡、精准)。
提示词
DALLE
Stable Diffusion
Stable Diffusion生成图片参数查看与抹除
查看图片的生成参数 1、打开Stable Diffusion WebUI,点击Tab菜单中的【图像信息/PNG Info】,不
同
版本的WebUI可能显示的文字或略有不
同
。
文生图
Stable
Diffusion
大模型
OCR的终极解法——传统算法VS多模态大模型
同
样的如果是身份证这些有固定格式类型的,确实通过规则匹配抽取出我们想要的关键信息。
OCR
大模型
文字识别
RAG
检索增强生成(RAG)有什么好的优化方案
ensp; 私有化多模态RAG(文本+表格+图片) 1)半结构化RAG(文本+表格) 图6 半结构化RAG 此模式要
同
时处理文本与表格数据
RAG
检索增强生成
一键部署本地“妙鸭”,证件照,写真照,模特换装全部搞定!
如果想细致了解这些参数的
同
学,可以查看这篇——【Lora炼丹术】从零开始,炼制你的第一个LoRA(1) 点击开始训练,输入一个模型名字就可以开始训练了。
妙鸭
文生图
开源
开源免费离线语音识别神器whisper如何安装
当然,我们知道一些商业公司提供语音识别服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不
同
,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper识别准确率相当高
wisper
翻译
免费
Stable Diffusion
Stable Diffusion 常用LoRA模型推荐
关键词:full body,chibi, 权重建议:1 大模型: RevAnimated 或者其他你喜欢的都行(不
同
模型出来的结果差异较大,建议使用写实风格类的模型,但是用其他模型也会有不一样的画风出来
文生图
SD
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
当然,作为多模大模型,通用能力的保持也是必须的: Vary 表现出了很大的潜力和极高的上限,OCR 可以不再需要冗长的 pipline,直接端到端输出,且可以按用户的 prompt 输出不
同
的格式如
OCR
手写
文字识别
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音频生成开发框架
· AudioCraft使用 · · AudioCraft开源地址 · AudioCraft简介 产生高保真音频任何类型的音频都需要对不
同
尺度的复杂信号和模式进行建模
开源模型
视频
字节跳动推出MagicVideo-V2:引领AI视频生成新时代。
无论是创意短片、教育教程还是商业广告,MagicVideo-V2都能根据你的文字描述,生成高保真度和高分辨率的视频内容,
同
时确保视频的流畅运动和连贯性。
MagicVideo-V2
视频生成
Stable Diffusion
小白也可以一键安装的Stable Diffusion——Easy Diffusion
简洁的用户界面:友好且简单的用户界面,
同
时提供许多强大的功能。
Stable
Diffusion
插件
安装
<
...
72
73
74
75
76
77
78
79
80
81
...
>
1
2
4
5
6
7
8
9
100