首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 必看!阿里通义千问完整技术报告
· MCP服务介绍及应用场景报告-来自Manus
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 实测:本地跑llama3:70B需要什么配置
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion教程:提示词
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 爆火的“女孩的一生”,plus版教程它来了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
解读OpenAI Sora文生视
频
技术原理
OpenAI Sora文生视
频
(图像看作单帧视
频
)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。
sora
开源
GitHub星数暴涨,AIPC的开源实现,用AI记
录
电脑一整天的使用太简单了,功能非常多!
项目简介 ScreenPipe 在你的计算机上 7*24小时 全天候记
录
你的电脑屏幕和麦克风,数据由用户自行掌控,确保隐私和安全,并且把记
录
的数据连接到大模型
AIPC
ScreenPipe
开源
工具
FFmpeg之父新作——音
频
压缩工具 TSAC
前两天FFmpeg作者Fabrice Bellard在个人主页发布了一款音
频
压缩工具TSAC。
TSAC
音频工具
大模型
视
频
大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视
频
生成模型。
视频生成
sora
词条
ChatGPT
一个完整Prompt让ChatGPT自动生成短视
频
制作脚本
———————— 把你想象成热门短视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生成栩栩如生的人物说话头像视
频
它通过先进的音
频
到3D网格映射技术和网格到视
频
的转换技术,实现了高质量、逼真的音
频
驱动的说话头像视
频
生成。
VividTalk
视频
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练视
频
剪辑相似的图像。
动画
视频
AnimateDiff
开源
语音、视
频
转文字神器:开源whisper介绍
用法 直接使用whisper指令识别音
频
和视
频
文件为文本,如: whisper video.mp4 这里需要重点说明的是,默认会生成5个文件,文件名和你的源文件一样,但扩展名分别是:.json
人工智能
大模型
wisper
工具
开箱即用的图像增强、视
频
增强AI工具,Upscapl、Topaz Video AI
图像和视
频
领域使用较多的AI工具,免安装,无需会员,开箱即用!
图像增强
视频增强
阿里
阿里出品自动化视
频
剪辑工具FunClip!
FunClip让用户能够根据识别结果,轻松选择文本片段或特定说话人,从而快速裁剪出所需视
频
片段。
FunClip
视频
阿里
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
这就是视
频
压缩网络闪亮登场的时刻,它能够在不牺牲视
频
质量的前提下,极大地减少数据的大小。
视频生成
sora
OpenAI
【语音识别】OpenAI语音力作Whisper
与Wav2Vec 2.0等前作不同,以往的模型都是在未标注的音
频
数据上预训练的,而 Whisper 是在大量的已标注音
频
转
录
数据上预训练的。
语音转文字
whisper
VividTalk:用一张照片和一段音
频
让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的视
频
的技术。
VividTalk
视频
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的文本生成视
频
插件
在小视
频
风靡的时代,稳定的文本生成短视
频
成为了迫切需求。
AnimateDiff
视频
训练
Sora
中学生也能看懂的Sora视
频
生成原理解读
其次,这种方法极大地提高了处理视
频
的灵活性,使得Sora能够生成具有复杂动态的高质量视
频
,而这对于传统视
频
生成技术来说是一个巨大的挑战。
视频生成
sora
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100