首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 硬核解读Stable Diffusion(系列一)
· AI换脸工具:facefusion使用心得
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
· 实测:本地跑llama3:70B需要什么配置
· RVC和SVC声音模型难找?推荐这个网站
· AI自动生成视频全流程干货
· Suno音乐新手指南(手把手完整版教程)
· 中文LLaMA-2基座模型和Alpaca-2指令精调大模型-中文LLaMA-2以及Alpaca-2系列模型
· 大模型高效微调:🤗 PEFT 使用案例
· 盘点来自工业界的GPU共享方案
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stability AI推出
视
频
生
成
模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的
视
频
生
成
模型,该模型基于该公司现有的Stable Diffusion
文
本
转图像模型,能够通过对现有图像进行动画化
生
成
视
频
Video
视频创作
SD
AGI
字节跳动推出MagicVideo-V2:引领AI
视
频
生
成
新时代。
你是否曾想过,仅凭一段
文
字就能
生
成
一段高清、流畅的
视
频
?
MagicVideo-V2
视频生成
Sora
OpenAI Sora
视
频
生
成
模型技术报告中英全
文
+总结+影响分析
我们将Sora与一个版
本
的模型进行了比较,该模型将所有训练
视
频
裁剪
成
正方形,这是训练
生
成
模型时的常见做法。
sora
openai
视频生成
换脸
Wunjo AI: 合
成
和克隆英语/俄语/中
文
语音,实时语音识别,深度换脸和唇动合
成
,通过
文
本
提示更改
视
频
,分割和修饰
无论您是钻研语音合
成
、制作 Deepfake 动画、通过
文
本
提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
开源
语音、
视
频
转
文
字神器:开源whisper介绍
Windows using Scoop (https://scoop.sh/) scoop install ffmpeg 模型说明 有五种模型大小可供选择,其中除了large模型外还提供了只支持英
文
的版
本
人工智能
大模型
wisper
ChatGPT
ChatGPT+
文
字转
视
频
工具,让1个人1天轻松
生
产100条原创
视
频
(内附全部工具)
今天给大家分享一个 ChatGPT+
文
字转
视
频
AI工具,批量跑原创
视
频
的玩法。
生成式AI
大模型
大模型
文
本
生
成
——解码策略(Top-k & Top-p & Temperature)
在自然语言任务中,我们通常使用一个预训练的大模型(比如GPT)来根据给定的输入
文
本
(比如一个开头或一个问题)
生
成
输出
文
本
(比如一个答案或一个结尾)。
大模型
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可
生
成
逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生
成
,实现
生
动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头
生
成
。
MagicPose
视频
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生
成
栩栩如
生
的人物说话头像
视
频
它通过先进的音
频
到3D网格映射技术和网格到
视
频
的转换技术,实现了高质量、逼真的音
频
驱动的说话头像
视
频
生
成
。
VividTalk
视频
【NLP技术分享】
文
本
生
成
评价指标的进化与推翻
前言
文
本
生
成
目前的一大瓶颈是如何客观,准确的评价机器
生
成
文
本
的质量。
开源模型
Sora
快手版Sora「可灵」开放测试:
生
成
超120s
视
频
,更懂物理,复杂运动也能精准建模
当然,除了模型自身的能力,用户输入的
文
本
提示词也对最终
生
成
的效果有着重要影响。
可灵
快手
文生视频
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/
文
本
其中一部分数据来源于书籍和论
文
,经过解析
生
成
交错图像-
文
本
、OCR数据和图表数据。
Baichuan-Omni
多模态大模型
语音
栩栩如
生
,音色克隆,Bert-vits2
文
字转语音打造鬼畜
视
频
实践
它是在
本
来已经极其强大的Vits项目中融入了Bert大模型,基
本
上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的
成
本
开销普通人也完全可以接受。
Bert-vits
语音
Sora
Sora懂不懂物理世界?
生
成
视
频
的物理问题,并总结如下: 首先,用概率统计的相关性无法精确表达物理定律的因果性,自然语言的上下
文
相关无法达到偏微分方程的精密程度; 其次,Sora无法判断全局的合理性。
文生视频
视频生成
sora
Sora
通俗易懂地解释OpenAI Sora
视
频
生
成
的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
有很多童鞋似乎对这些问题依然有疑问,
本
文
将以通俗的语言解释Sora的独特之处。
sora
视频生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100