首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的
视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似
视
频
。
语音
HeyGen
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
随着Sora等文生
视
频
模型掀起热潮,很多人都在探讨文生
视
频
模型能不能算作世界模型。
通义
文生视频
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌
视
频
,还是讲话
视
频
,只要提供一张肖像照片,外加一段音
频
,算法就会自动生成一段口型完全能对上、画面生动的
视
频
出来。
EMO
阿里
全民演唱
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生成开发框架
在过去的几年里,我们看到了AI在图像、
视
频
和文本生成方面的巨大进步。
开源模型
工具
FFmpeg之父新作——音
频
压缩工具 TSAC
前两天FFmpeg作者Fabrice Bellard在个人主页发布了一款音
频
压缩工具TSAC。
TSAC
音频工具
AI绘画Stable-Diffusion风格化实战
在社交软件和短
视
频
平台上,我们时常能看到各种特色鲜明的
视
觉效果,比如卡通化的图片和中国风的
视
频
剪辑。
Stable-Diffusion
文生图
ComfyUI
教会AI画汉字(ComfyUI篇)
最近,央
视
公开了一些由ai生成的图片与
视
频
,其中有几张图片非常有趣,成功吸引到了我, 那便是这几张由ai与文字相结合的图片,这种奇妙的效果令我十分好奇,于是我便开始找寻相关的插件来达成类似的效果
comfyui
文生图
人工智能
AI产品经理
视
角:如何构建人工智能产品
虽然它们都提供了令人兴奋的研究
视
角,但现实生活中的产品需要将数据、模型和人机交互结合到一个连贯的系统中。
大模型
产品经理
一文彻底搞懂多模态 - 多模态推理
这两种模态的信息可以是图片和文本、
视
频
和语音等。
多模态推理
大模型
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成
视
频
就不行。
SadTalke
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套
视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和
视
频
介绍等应用。
ChatTTS
语音合成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100