首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内外开源大语言模型一览表
· AI必备Prompt技巧《提问的艺术——让AI导出高质量答案》
· 硬核解读Stable Diffusion(系列一)
· 掌握这10个AI 工具用1小时完成别人1周的工作
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
· 如何下载及使用通义千问7B开源大模型
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 使用python调用comfyui-api,实现出图自由
· Stable Diffusion生成美女正向词和反向词示例
· 比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LangChain 的问题所在
摆脱繁琐,追求高
效
。
大模型
大语言模型
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
你想把一种语言的语音或文字直接转换成另一种语言的语音或文字,但是你需要用多个工具,而且
效
果不理想!
大模型
开源模型
语音
写作
GPT让你拥有超强的写作能力!
在职场中,写作是一项不可或缺的技能,无论是撰写电子邮件、报告、计划书还是演示文稿,清晰有
效
的书面沟通都是成功的关键。
GPT
写作
SDXL
【分享】SDXL模型最佳拍档!COMFY UI上手指南
理论上,SDXL 1.0 应该在具有 8GB VRAM 的 GPU 上有
效
工作。
大模型
语音
语音克隆又又又又又升级了
,时隔几个月Meta又推出了最新的语音生成技术,不仅能可能声音,还能通过对声音的描述来生成独特的音色,同时还能通过描述来生成各种各样的音
效
,甚至能通过文字描述来编辑声音,整体来说,这项技术几乎囊括了现在人们对语音生成技术的所有的需求
Meta
语音生成
我用AI写小说:「国学篇」如何将国学插入小说中
通过上述多种方法的结合与运用,国学文化能够在小说创作中焕发新的生命,达到教化与娱乐相结合的
效
果,让读者在享受阅读的同时,潜移默化地受到传统文化的熏陶。
国风
国学
写作
开源
语音、视频转文字神器:开源whisper介绍
下图展示了使用large-v2模型对Fleurs数据集进行的WER(词误
率
)语言拆解。
人工智能
大模型
wisper
LLM
PymuPDF4llm:PDF 提取的革命
然而,从 PDF 中高
效
、准确地提取信息一直是一个具有挑战性的任务。
PymuPDF4llm
PDF
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高
效
。
音频
Whisper
用AI生成PPT、用AI优化PPT!
我在前几天写过五大AI工具自动生成PPT
效
果对比(点击看原文),当时我在文中引用的是百度AI对话的PPT生成插件,我对这个插件生成的PPT的评价不高,但是在体验了百度文库的智能PPT功能后,有种“识别三日
AI
ppt
ChatGPT
爆肝两天!ChatGPT+提示词解决知识库目录混乱
对于职场新手可能缺乏有
效
的知识管理和分类技巧,导致知识库变得错综复杂。
智能分类
大模型
知识库
Stable Diffusion
Stable Diffusion 抽卡必备神器!Agent Scheduler
相信大家在玩 Stable Diffusion 的时候一直有一个痛点,每次出图抽卡时都只能等待上一次抽卡结束,才能继续下一次抽卡; 特别是当我们想抽大量的卡来测试不同的模型,不同的参数的
效
果时,那么是非常奔溃的
Agent
Scheduler
Stable
Diffusion
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
在身体姿态估计任务上,使用CNN提取的特征,结合定制化的transformer模块进行特征增强,视觉transformer取得了很好的
效
果。
ViTPose+
Transformer
身体姿态
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
视觉编码器Siglip - 400m则专注于图像信息的处理,以384分辨
率
和14×14的块大小生成图像嵌入,将图像转换为模型可理解的向量表示。
OmniVision
-
968M
多模态模型
Midjourney
AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
相信很多同学在使用Midjourney生成肖像绘画时,都遇到过这样的困扰:明明想要AI帮我画一张逼真的肖像作品,但是无论怎么尝试提示词,生成的结果要么不伦不类,要么就是缺乏细节,无法达到预期的逼真
效
果。
文生图
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100