首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
Prompt屠龙术-大厂prompt工程指南
解
析提炼
让您的指令易于理
解
,以便人工智能能够快速掌握您的意
图
。
prompt
大模型
解析
大模型
最强国产开源多模态大模型MiniCPM-V:可识别
图
片、视频,还可在端侧部署
MiniCPM-V是面向
图
文理
解
的端侧多模态大模型系列。
minicpm
面壁
盘点数据安全合规方向的热门证书【快来了
解
一下】
获得CIPP/E认证代表对GDPR知识点的全面掌握,以及足够的理
解
数据保护&在欧洲的相关法规,并在欧洲隐私法的相关职业发展上占据优势。
工作
Stable Diffusion
Stable Diffusion | SD的老舅ComfyUI来了,节点式工作流,分部控制出
图
也可以鼠标双击界面,弹出搜索窗口,直接搜索常用版块: 一般会有主模型/提示词(clip模型)/采样器/初始潜空间(参数设置)/VAE
解
码器/
图
像保存。
生成式AI
语音
语音识别的未来已来:深入了
解
faster-whisper的突破性进展
faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度,还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度,这使得它在处理大规模语音数据时更加高效。
语音识别
Faster-Whisper
深度
解
读|做出海必看的一份产品报告
前段时间我们分析的 Voiceflow 和经典的小而美 SaaS企业 Calendly 都是 OpenView 被投版
图
的一部分。
工作
换脸
技术爆炸!AI一
图
换脸新王者,Instant ID保姆级安装与使用测评
在SD中有很多人物换脸的新技术,比如像之前的Roop还有ReActor,它们都可以实现仅凭一张
图
进行人物换脸,后来又出现了EasyPhoto,可以通过快速炼制的小模型来对人物进行模仿。
Instant
ID
文生图
LLM
Agent : 一文读懂LLM Agent架构,详
解
Profile,Memory,Planning,Action模块作用
对于对Agent感兴趣的朋友们,我推荐一篇论文,它全面地介绍了Agent的架构,对于理
解
Agent的全局有着重要的价值。
大模型
LLM
Agent
开源
令人惊艳的开源
图
标生成AI模型:ChartLlama (南洋理&腾讯)
ChartLlama是一个由南洋理工大学和腾讯联合开发的多模态语言模型,它可以根据你的指令来理
解
和生成
图
表。
ChartLlama
开源模型
图标
大模型
8G显存一键训练,
解
锁Llama2隐藏能力!XTuner带你玩转大模型
InternLM/xtuner (文末点击阅读原文可直达,欢迎体验) X 种选择 XTuner 提供了丰富的功能,上
图
中的各项功能都可以随意组合搭配
大模型
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到
解
决方案
Rerank为什么可以
解
决这个问题?
RAG
检索增强
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的
图
片音频可以生成,而用自己的
图
片、音频生成视频就不行。
SadTalke
OpenAI
《OpenAI官方:GPT 最佳实践》大白话编译
解
读版本
值得注意的是,这文章原版为全英文,但并非繁琐深奥,任何人都可轻松理
解
并掌握其精髓。
提示词
官方
翻译
大模型
OCR的终极
解
法——传统算法VS多模态大模型
多模态大模型是一类采用深度学习技术构建的人工智能模型,它能够处理和理
解
多种类型的数据模态,如文本、
图
像、声音等。
OCR
大模型
文字识别
Sora
中学生也能看懂的Sora视频生成原理
解
读
Sora面对的挑战就像是需要处理和理
解
来自世界各地、不同设备拍摄的数以百万计的
图
片和视频。
视频生成
sora
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100