文章列表-AI魔法学院

文章列表

OpenAI视频模型Sora的推理生成成本多高？

由于 Diffusion 模型训练 text to video 需要高质量的标注视频，因此我们可以估计 Sora 训练的视频量级为 1亿分钟左右。

Sora 推理算力

中国首个长时长、高一致性、高动态性视频大模型，Vidu 登场

1080P的高清视频内容。

Vidu 大模型视频

生成式AI工作流#产品经理和创业者的秘密武器

Stable Diffusion VS ComfyUI界面ComfyUI不仅仅是让AIGC创作者可以更自由地创作，它的流程逻辑的可视化、可复用以及数据的实时可验证，不就等同于产品原型构建工具么

AIGC 工作流

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

阿里动作太过频繁，就我的脑海回忆，推出了挺多东西的，效果还都不错，今天盘点下都有哪些。

阿里云视频音频

AIGC工作流: 新时代产品经理和创业者的秘密武器

Stable Diffusion VS ComfyUI界面ComfyUI不仅仅是让AIGC创作者可以更自由地创作，它的流程逻辑的可视化、可复用以及数据的实时可验证，不就等同于产品原型构建工具么？

大模型 AIGC

Stable Diffusion

读取大脑重建高清视频，Stable Diffusion还能这么用

但以往的研究都主要聚焦在重建静态图像，而以高清视频形式来展现的工作还是较为有限。

stablediffusion

巧用这13个原则！创作ChatGPT提示词Prompt时效率提高10倍！

6 - 输出的信息层面一定使用“以自然且类似人类的方式回答问题”作为你的提示。

prompt 提示词

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

其具体的技术流程主要包括以下几个关键步骤： 1、数据预处理：首先，对输入的音频文件进行采样率转换和分帧等预处理操作。

clone-voice 声音克隆

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

，用于在具有挑战性的人舞视频中进行2D人体动作和面部表情的转移。

MagicPose 视频

Stable Diffusion

Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法

之前虽然小视频生成比较火，不过出的视频都不太稳定，目前来看 AnimateDiff 是相对比较稳定的，而且能同时支持和其他插件一起使用。

动画 animate sd

Stable Diffusion

Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法！

之前虽然小视频生成比较火，不过出的视频都不太稳定，目前来看 AnimateDiff 是相对比较稳定的，而且能同时支持和其他插件一起使用。

文本生成视频 AnimateDiff

GPT-4o实时语音方案提供商Livekit开源voice agent：轻松处理音视频流

轻松访问 LiveKit WebRTC 会话并处理或生成音频、视频和数据流。

voice agent 开源音视频

结构化Prompt必备基础：5分钟学会Markdown语法，实现提示词创作自由！

在这些天的项目进程中，我们已初步尝到了团队协作创建结构化Prompt的甜头。

Prompt 提示词 Markdown

用AI做郭德纲说英文相声的爆款视频（详细教程）

郭德纲用英文说相声的短视频火爆全网，单条视频点赞破9.7万，转发量更是高达11.8万，AI的内容形式层出不穷，不断地出爆款，其实这个两周前有出过教程--用这个AI，把视频翻译成30+种语言，丝滑程度，随时能把生意做到全世界

视频翻译语言

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

.01 概述在日常生活和工作中，你是否常因嘈杂的环境、重叠的对话或音视频信号的混杂而感到沟通困难？

ClearerVoice-Studio 语音

<1 234 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1