首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
写作
火山写作:一款助力写作能力提升的AI助手
这是由字节跳动的火山引擎团队精心打造的AI创作辅助
工
具
,无论是修改毕业论文、精炼个人简历,还是进行全文修订、检查语法拼写错误,添加生动词汇及灵活修改等,火山写作都能为您提供全方位的协助。
火山写作
工具
文章
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的文本到语
音
(TTS)
工
具
,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
语
音
克隆又又又又又升级了
早在今年6月,Meta曾经推出过VoiceBox,能直接从文本生成高质量语
音
,不需要任何
音
频
样本作为训练数据,可能是基于对
音
频
Deepfake的担忧,一向秉承开源的Meta并未向
工
作开放VoiceBox
Meta
语音生成
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
OpenAI在X上发布消息 在此之前,尽管Runway、Pika、Kreadoai、Moonvalley、Pixverse等早已推出了各
具
特色的视
频
生成
工
具
,但OpenAI的Sora视
频
生成模型如同一颗新星
视频生成
sora
教程
Suno
音
乐新手指南(手把手完整版教程)
Suno是当前全球
音
乐创作领域的头部
工
具
,地位堪比GPT、Midjourney和Sora等巨头。
suno
歌曲
教程
AI拟声: 5秒内克隆您的声
音
源代码: http://www.gitpp.com/godan/mockingbird MockingBird是一个人
工
智能开源项目,它可以在仅仅5秒钟内克隆你的声
音
。
声音克隆
开源
阿里
淘宝模特全体注意!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图
工
具
,重塑电商模特产业
但近日,阿里和港大联手推出了一个
工
具
,可以轻松实现一键换衣,更重要的是,操作简单,实现效果惊人。
AnyDoor
换装
文生图
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
这也意味着用户无法自行上传
音
频
内容,只能通过官方创建好的模板来上传图片,生成固定
音
频
内容的视
频
。
EMO
阿里
全民演唱
实时语
音
克隆
在第一阶段,人们从几秒钟的
音
频
中创建声
音
的数字表示。
语音
克隆
Sora
中学生也能看懂的Sora视
频
生成原理解读
具
体到Sora的实现,这个过程开始于一段与目标视
频
同样时长、但是内容完全是随机噪声的视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入视
频
扩散模型
也就是说,此番登场的SV3D首次将视
频
扩散模型应用到了3D生成领域。
sv3d
建模
被高估的Pika,被低估的多模态AI
从 GPT-4V 的“惊艳亮相”,到 AI 视
频
生成
工
具
Pika 1.0 的“火爆出圈”,再到谷歌 Gemini 的“全面领先”,多模态 AI 都是其中的关键词。
大模型
多模态
AGI
字节跳动推出MagicVideo-V2:引领AI视
频
生成新时代。
MagicVideo-V2的
工
作原理分为四个步骤:首先,T2I(Text-to-Image)模块根据文字描述生成图像;然后,I2V(Image-to-Video)模块将生成的静态图像动画化
MagicVideo-V2
视频生成
AI自动生成视
频
全流程干货
AI自动剪辑短视
频
本文
工
具
集合:https://shorturl.at/kuU78 1.
AI
视频
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100