首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
生
成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生
成开发框架
在过去的几年里,我们看到了AI在图像、
视
频
和
文
本
生
成方面的巨大进步。
开源模型
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或
生
成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
VividTalk:用一张照片和一段音
频
让人物栩栩如
生
地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
如下图所示,相比去年诞
生
的Layered neural atlas算法,CoDeF能够呈现非常忠于原
视
频
的细节,既没有变形也无破坏。
ControlNet
Roop参数说明,ROOP->StyleGAN演示!
首先,简单说一下,
视
频
的原素材全部由AI
生
成!
视频
StyleGAN
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将
文
本变换成语音的AI工具。
TTS
文本转语音
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
它不仅能够根据
文
字指令创造出既逼真又充满想象力的场景,而且能
生
成长达1分钟的超长
视
频
,不管是一镜到底还是分镜头切换模式,都能够保持角色及背景神一般的一致性和稳定性。
视频生成
sora
Stable Diffusion
Stable Diffusion教程:
文
生
图
最近几天AI绘画没有什么大动作,正好有时间总结下Stable Diffusion的一些基础知识,今天就给大家再唠叨一下
文
生
图这个功能,会详细说明其中的各个参数。
文生图
Stable
Diffusion
Prompt
文
生
图提示词prompt详解
提示词 Prompt 用
文
字描述你想要
生
成的东西 支持的语言 支持的输入语言为英语(不用担心英语不好的问题,目前网上有很多tag
生
成器供你使用),SD支持用自然语言描述,不过还是推荐使用用逗号分隔的一个个的关键词来写
SD
prompt
文生图
提示词
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
该系列模型接受图像和
文
本输入,并提供高质量的
文
本输出。
minicpm
面壁
提示词
文
生
图
生
成不同年龄段模特的提示词
第一步:输入正面提示词 任意复制以下2个年龄提示词之一,只复制英
文
部分!
年龄
文生图
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段音
频
和一个
视
频
,PersonaTalk便能精准同步人物的口型,不仅让声音和嘴型无缝贴合,还能保留
视
频
中人物的表情和个性化说话风格,仿佛原
生
发声一般自然流畅。
PersonaTalk
视频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在音
频
驱动的
视
频
生
成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
大模型
中
文
原
生
文
生
图大模型来了!腾讯混元推出,Sora 同架构
升级后的混元
文
生
图大模型采用了与 sora 一致的DiT架构,不仅可支持
文
生
图,也可作为
视
频
等多模态
视
觉
生
成的基础。
文生图
混元
腾讯
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100