首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI换脸工具:facefusion使用心得
· MCP服务介绍及应用场景报告-来自Manus
· 我用AI写小说:「国学篇」如何将国学插入小说中
· 9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
· 使用自己的数据训练清华ChatGLM2-6B 模型
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· ComfyUI官方使用手册【官网直译+关键补充】
· [Stable Diffusion]SD安装、常用模型(checkpoint、embedding、LORA)、提示词具、常用插件
· YOO简历
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
OpenAI
视
频
模型Sora的推理生成成本多高?
由于 Diffusion 模型训练 text to video 需要高质量的标注
视
频
,因此我们可以估计 Sora 训练的
视
频
量级为 1亿 分钟 左右。
Sora
推理
算力
大模型
中国首个长时长、高一致性、高动态性
视
频
大模型,Vidu 登场
1080P的高清
视
频
内容。
Vidu
大模型
视频
生成式AI工
作
流#产品经理和
创
业者的秘密武器
Stable Diffusion VS ComfyUI界面ComfyUI不仅仅是让AIGC
创
作
者可以更自由地
创
作
,它的流程逻辑的可
视
化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么
AIGC
工作流
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和
视
频
焕发新生!
阿里动
作
太过
频
繁,就我的脑海回忆,推出了挺多东西的,效果还都不错,今天盘点下都有哪些。
阿里云
视频
音频
AIGC
AIGC工
作
流: 新时代产品经理和
创
业者的秘密武器
Stable Diffusion VS ComfyUI界面ComfyUI不仅仅是让AIGC
创
作
者可以更自由地
创
作
,它的流程逻辑的可
视
化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么?
大模型
AIGC
Stable Diffusion
读取大脑重建高清
视
频
,Stable Diffusion还能这么用
但以往的研究都主要聚焦在重建静态图像,而以高清
视
频
形式来展现的工
作
还是较为有限。
stablediffusion
ChatGPT
巧用这13个原则!
创
作
ChatGPT提示词Prompt时效率提高10倍!
6 - 输出的信息层面一定使用“以自然且类似人类的方式回答问题”
作
为你的提示。
prompt
提示词
开源
clone-voice:一键克隆声音,开源AI技术让声音
创
作
更便捷、更个性化
其具体的技术流程主要包括以下几个关键步骤 : 1、数据预处理:首先,对输入的音
频
文件进行采样率转换和分帧等预处理操
作
。
clone-voice
声音克隆
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
,用于在具有挑战性的人舞
视
频
中进行2D人体动
作
和面部表情的转移。
MagicPose
视频
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
Prompt
结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词
创
作
自由!
在这些天的项目进程中,我们已初步尝到了团队协
作
创
建结构化Prompt的甜头。
Prompt
提示词
Markdown
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
.01 概述 在日常生活和工
作
中,你是否常因嘈杂的环境、重叠的对话或音
视
频
信号的混杂而感到沟通困难?
ClearerVoice-Studio
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100