首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
生
成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生
成开发框架
在过去的几年里,我们看到了AI在图像、
视
频
和
文
本
生
成方面的巨大进步。
开源模型
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或
生
成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
VividTalk:用一张照片和一段音
频
让人物栩栩如
生
地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
如下图所示,相比去年诞
生
的Layered neural atlas算法,CoDeF能够呈现非常忠于原
视
频
的细节,既没有变形也无破坏。
ControlNet
Roop参数说明,ROOP->StyleGAN演示!
首先,简单说一下,
视
频
的原素材全部由AI
生
成!
视频
StyleGAN
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将
文
本变换成语音的AI工具。
TTS
文本转语音
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
它不仅能够根据
文
字指令创造出既逼真又充满想象力的场景,而且能
生
成长达1分钟的超长
视
频
,不管是一镜到底还是分镜头切换模式,都能够保持角色及背景神一般的一致性和稳定性。
视频生成
sora
Stable Diffusion
Stable Diffusion教程:
文
生
图
最近几天AI绘画没有什么大动作,正好有时间总结下Stable Diffusion的一些基础知识,今天就给大家再唠叨一下
文
生
图这个功能,会详细说明其中的各个参数。
文生图
Stable
Diffusion
Prompt
文
生
图提示词prompt详解
提示词 Prompt 用
文
字描述你想要
生
成的东西 支持的语言 支持的输入语言为英语(不用担心英语不好的问题,目前网上有很多tag
生
成器供你使用),SD支持用自然语言描述,不过还是推荐使用用逗号分隔的一个个的关键词来写
SD
prompt
文生图
提示词
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
该系列模型接受图像和
文
本输入,并提供高质量的
文
本输出。
minicpm
面壁
提示词
文
生
图
生
成不同年龄段模特的提示词
第一步:输入正面提示词 任意复制以下2个年龄提示词之一,只复制英
文
部分!
年龄
文生图
数字人
AI虚拟主播数字人技术实现Wav2Lip
本
文
主要实现图片说话(如下图的蒙娜丽莎)、
视
频
融合语音(这里的核心都是人物口型与音
频
中的语音唇形同步)。
数字人
视频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段音
频
和一个
视
频
,PersonaTalk便能精准同步人物的口型,不仅让声音和嘴型无缝贴合,还能保留
视
频
中人物的表情和个性化说话风格,仿佛原
生
发声一般自然流畅。
PersonaTalk
视频
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在音
频
驱动的
视
频
生
成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100