首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
· 不用再羡慕Prompt大神了!看了这篇文章,你只需10秒钟,就能拥有自己想要的专业级Prompt!
· 用so-vits-svc-4.1进行音色转换的极简教程!
· 用Midjourney给自己制作精美的logo或头像
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
· 好看的图片不知道怎么写提示词?用AI读出来
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· 掌握 Midjourney 提示词技巧成为 25 个流派的摄影大师
· 这个方法可以让AI写出的文章完全去掉GPT味儿!
· 无需编码,轻松提升图像品质:探索ComfyUI的图像增强功能
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
:输入“
AI
”进行搜索,选择 Stable Diffusion
AI
绘画自定义
模
型
版。
下载
开源模型
教程
SD入门教程七:ControlNet篇-Canny边缘检测预处理器
目前最新的ControlNet
模
型
分为ControlNet 1.1
模
型
和ControlNet XL
模
型
; 2.
Canny
SD
开源
F5-TTS:上海交
大
开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
上海交
大
开源的F5-TTS实测下来确实是还不错了。
F5-TTS
音频克隆
微软
微软打破Decoder-Only架构!
大
幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
去年一张“
大
语言
模
型
进化树”动图在学术圈疯转,
模
型
架构还只有三
大
类:Decoder-Only、Encoder-Only、Encoder-Decoder。
Decoder-Decoder
YOCO
架构
工具
鹅厂最新
AI
工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
大
厂们在整活方面开始卷起来了!
PhotoMaker
图生图
LLM
PymuPDF4llm:PDF 提取的革命
随着人工智能和自然语言处理技术的发展,对能够与
大
型
语言
模
型
(LLMs)无缝配合的 PDF 提取工具的需求日益增长(利用LLM从非结构化PDF中提取结构化知识)。
PymuPDF4llm
PDF
Stable Diffusion
Stable Diffusion教程:文生图
最近几天
AI
绘画没有什么
大
动作,正好有时间总结下Stable Diffusion的一些基础知识,今天就给
大
家再唠叨一下文生图这个功能,会详细说明其中的各个参数。
文生图
Stable
Diffusion
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉
大
秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲
大
秀英语」等类似视频。
语音
HeyGen
SDXL
它来了!SDXL + ControlNet 终于强强联合!
此
模
型
在上期制作“隐藏字”的文章中已经
大
展拳脚。
SDXL
Midjourney
【万字干货】掌握 Midjourney 提示词技巧成为 25 个流派的摄影
大
师
这种类
型
的摄影的本质是捕捉食物的颜色、质地和摆放。
文生图
训练
提示词
Midjourney
视频
超越Animate Anyone! 南加
大
&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose
模
块可以被视为原始文本到图像
模
型
的扩展/插件,而无需修改其预训练的权重。
MagicPose
视频
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 不仅有一个开源的 voice agent 方案[1],还能为你提供一个成熟且强
大
的实时多
模
态
AI
解决方案。
GPT-4o
语音交互
微信向量检索分析一体化数仓探索:OLAP For Embedding
背景 在过去的一年里,
大
型
语言
模
型
(LLM) 以及 ChatGPT 等产品吸引了全世界的想象力,推动新一轮技术浪潮。
OLAP
For
Embedding
一体化数仓
Stable Diffusion
Stable Diffusion基础:ControlNet之身份标识
本文给
大
家分享一个新的ControlNet类
型
:Instant ID,翻译为身份标识,核心能力是由国内的小红书团队开发的。
ControlNet
文生图
pdf2htmlEX:效果相当好的一个PDF转HTML程序,和原始PDF几乎一
模
一样。
项目简介 这应该是效果相当好的一个PDF转HTML程序,生成的结果和原始PDF几乎一
模
一样。
PDF转换
<
...
64
65
66
67
68
69
70
71
72
73
...
>
1
2
4
5
6
7
8
9
100