首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ComfyUI | 这么入门就顺了,硬入疼的是自己
· 在SD中一键换脸!!!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 实测:本地跑llama3:70B需要什么配置
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
· AI开源 - LangChain UI 之 Flowise
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
比 remini 更便宜,比美图更有风格!黏土滤镜免费做,速领
整体的逻辑:使用 SDXL 大
模
型,提示词用 SDXL 风格选择器中的黏土风,结合 controlnet 和 lora,直接图生图即可。
SDXL
文生图
Logo
AI打破设计界限:一文教你免费打造专属Logo!
选择“更多创造力”
模
式。
文生图
人工智能
深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
深度学习是机器学习的一种,可以利用神经网络
模
型学习图像特征,从而让计算机可以基于图片进行分类和识别。
人工智能
语音
国内厂商语音识别与Whisper评测:现状与概况对比
一、语音识别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、语音识别现状 得益于近年来深度学习技术的快速发展,人工智能的主要分支(图像、语音、自然语言处理等)都相继进入了大规
模
落地应用阶段
语音识别
Faster-Whisper
提示词
Anthropic推出提示词生成器让AI秒懂你的需求!
与其他
模
型的兼容性 值得一提的是,提示词生成器生成的提示不仅可以在 Claude的
模
型中使用,还可以兼容其他的AI
模
型。
Anthropic
提示词
生成器
RAG
RAT = CoT + RAG
开发能够像人类一样思考、推理并解决复杂问题的
模
型一直是人工智能研究的关键目标。
RAT
协同思维链
检索增强生成
使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
初始化 Dify 中的
模
型配置 点击界面右上角的用户头像,在下拉菜单中点击“设置”,在弹出窗口中选择左侧的“
模
型供应商”菜单,能够看到 Dify 支持配置使用的所有
模
型类型。
Dify
Moonshot
API
工作流
开源
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
audio2photoreal的核心技术是基于深度学习的图像生成
模
型,它可以从音频中提取语音特征,然后用这些特征来控制人脸和身体的运动。
audio2photoreal
开源工具
ComfyUI
ComfyUI学习笔记:插件安装
使用插件管理器 刚才安装的ComfyUI Manager,实际上是一个插件及
模
型管理器,可以用它来浏览其他可选的插件列表并安装。
comfyui
插件
绘画
Prompt
两个案例教你如何用BRTR原则优化Prompt
这个 Prompt 非常
模
糊,没有提供足够的信息。
BRTR
Prompt
写作
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
字节跳动和浙江大学的科研团队联合开发的基于音频驱动的视频扩散
模
型LOOPY完美解决了这个问题。
Loopy
视频
教程
SD入门教程零:应用场景
2.换脸 给
模
特换脸,比如有一个
模
特可以换各种样式的脸,同样可以对于
模
特的局部(眼睛、嘴唇、鼻子、嘴巴)做出变化,还能控制
模
特的微表情(开心、忧伤、生气等)。
Stable
Diffusion
文生图
入门教程
ComfyUI
ComfyUI 图片以及工作流管理神器
再回到最开始的界面哈,在这个界面上可以管理我们的图片库,支持
模
糊搜索图片,可以删除我们不想要的图片,点击加载会在 ComfyUI 的界面上加载对应的工作流。
comfyui
工作流
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
小到大检索背后的概念是在检索过程中使用较小的文本块,然后将检索到的文本所属的较大文本块提供给大语言
模
型。
RAG
检索
下载
8个常用中文OCR数据集,附下载链接
在MSRA-TD500数据集中,难以检测的文字(一般由低分辨率、
模
糊和遮挡等因素造成)会被标记为“困难”。
OCR
<
...
77
78
79
80
81
82
83
84
85
86
...
>
1
2
4
5
6
7
8
9
100