首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 本地部署Manus+DeepSeek保姆级教程!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· GPU 性能(数据表)快速参考
· 盘点数据安全合规方向的热门证书【快来了解一下】
· YOO简历
· 五大AI工具自动生成PPT效果对比
· 实测:本地跑llama3:70B需要什么配置
· 划重点!全网最全AI数字人工具合集!
· 阿里Outfit Anyone实现真人百变换装
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI制作艺术二维码 - 文生图
生成艺术二维码有两种方法: 一是直接使用
提
示
词,也就是文生图,这样出来的二维码比较漂亮,但是细节很难控制。
文生图
Stable Diffusion
超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
提
示
词风格样式: .
文生图
comfyui
OCR
完全指南——使用python
提
取PDF中的文本信息(包括表格和图片OCR)
页面的完整文本内容 图1:文本
提
取
示
意 这样,我们可以实现对每个PDF组件
提
取的文本的更合乎逻辑的分离,并且有时可以帮助我们更容易地检索通常出现在特定组件中的信息
大语言模型
python
开源
GPT-4o实时语音方案
提
供商Livekit开源voice agent:轻松处理音视频流
· 插件:一个库类,用于执行来自特定
提
供程序的特定任务,例如语音转文本。
voice
agent
开源
音视频
Stable Diffusion
张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
今天要学习的就是我上一篇笔记中所
提
到的Turbo,在官方的演
示
中这款软件实现了一打字就会出画面,画面随着
提
示
词的更改实时变化。
SDXL-Turbo
文生图
视频
超越Animate Anyone! 南加大&字节
提
出MagicPose,不需任何微调就可生成逼真的人类视频
南加州大学&字节
提
出MagicPose,一种新颖有效的方法,
提
供逼真的人类视频生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
ChatGPT
一个小妙招从Prompt菜鸟秒变专家!加州大学
提
出PromptAgent,帮你高效使用ChatGPT!
▲优化
示
例 可以看到,最终的这份Prompt涵盖了丰富的生物领域知识,且准确率得到了极大
提
升。
PromptAgent
大模型
深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
红衫最新发布了2024年AI的Top50榜单,2024 年版的 AI 50 展
示
了 生成式AI 如何开始改变企业生产力。
生成式AI
榜单
AI应用
LLM
从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统
这种方法可以
提
供更准确和最新的信息,利用来自各种来源的最新信息。
知识库
langchain
XX来信: 智能体设计模式2:Reflection
智能体工作流不是让LLM直接生成最终输出,而是多次
提
示
LLM,使其有机会逐步构建更高质量的输出。
Reflection
智能体
AI资讯速递 - 快人一步!为你填平AI领域信息差及时揭
示
AI领域的最新动态
这种信息不对称不仅可能导致个人在职业发展上的困境,也可能使企业错失利用AI技术
提
升效率和创新的机会。
AI资讯
AI新闻
SDXL
它来了!SDXL + ControlNet 终于强强联合!
我们都知道,相比起通过
提
示
词的方式,ControlNet 能够以更加精确的方式引导 stable diffusion 模型生成我们想要的内容。
SDXL
SDXL
总结些SDXL出人像时遇到的困难
一直想搞人像摄影类写真,苦于不知道出什么主题,这次的大英博物馆系列真是给我指明了方向,可以根据文物颜色、材质、内容出图,也是锻炼了我的
提
示
词能力。
文生图
SDXL
大模型
OCR终结了?旷视
提
出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
那么对于现在基于 CLIP 视觉词表的多模大模型也是一样的,遇到 “foreign language image”,如一页论文密密麻麻的文字,很难高效地将图片 token 化,Vary
提
出就是解决这一问题
OCR
手写
文字识别
Sora
中学生也能看懂的Sora视频生成原理解读
这种处理多样化视觉数据的能力,使得Sora在接收到如‘猫坐在窗台上’这样的文本
提
示
时,不仅能理解这个
提
示
背后的意图,还能利用它的内部表
示
形式,综合利用不同类型的视觉信息,生成与文本
提
示
相匹配的视频或图片
视频生成
sora
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100