首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 解读 | SuperCLUE 2023年9月全面测评大模型四大能力
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· ComfyUI 基础教程(一)环境部署和插件安装
· 火山写作
· 深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
· 耗时7天,终于把15种ControlNet模型搞明白了
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· 大模型训练工程那些事
· 教会AI画汉字(ComfyUI篇)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里最近推出
AI
项目的动作太过
频
繁,脑子跟不上了,事出反常必有妖,盘点一下
· I2VGen-XL, 阿里推出的图像到
视
频
生成模型,也就是图生成
视
频
又新增了一个
AI
工具,之前常用的效果好的有
阿里
大模型
换脸
AI
换脸——Deepfacelab 下载与安装,新手教程
AI
换脸越来越火,换脸的
视
频
到处都是,那种还是那种的都有。
Deepfacelab
换脸
Sora
Sora物理悖谬的几何解释
这里笔者依据现代数学特别是整体微分几何领域的一些观点来解释目前Sora技术路线中的缺陷,希望能够抛砖引玉,为广大
AI
研究和工程人员拓宽思路,共同促进提高。
Sora
解释
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成
视
频
就不行。
SadTalke
一文彻底搞懂多模态 - 多模态推理
这两种模态的信息可以是图片和文本、
视
频
和语音等。
多模态推理
大模型
AI
资讯速递 - 快人一步!为你填平
AI
领域信息差及时揭示
AI
领域的最新动态
AI
能够制作
视
频
吗?
AI资讯
AI新闻
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
了解Kimi必看的26个问题 | Kimi系列文(二)
了解到,目前的GenAI有文本类、
视
频
类、绘图类、音
频
类、编程类、PPT、数字人、
AI
搜索等形式。
Kimi
大语言模型
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套
视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和
视
频
介绍等应用。
ChatTTS
语音合成
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和音
频
生成
视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
数字人
腾讯出品!开源
AI
数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯音乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型同步,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
开源
通过声音生成逼真的全身形象?!Meta开源
AI
工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据音
频
生成逼真的人物
视
频
!
audio2photoreal
开源工具
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
、分离复杂声源并结合音
频
和
视
觉数据锁定目标发声者。
ClearerVoice-Studio
语音
阿里
体验完阿里的EMO模型,我emo了
简单来说,EMO(Emote Portrait Alive)是一个
AI
肖像
视
频
生成系统,能够通过输入单一的参考图像,生成具有一定表现力的面部标签和各种头部姿态。
EMO
文生图
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100