首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
你的下一个浏览器,可以是豆包电脑版!
万万没想到,现在看B站
视
频
的打开方式,竟然可以这么AI了。
豆包
浏览器
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套
视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
AI拟声: 5秒内克隆您的声
音
音
频
剪辑和制作:对于
音
频
制作人员来说,MockingBird也是一个强大的工具。
声音克隆
开源
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
教程
AI声
音
克隆 | 最全最简教程(权威版)
,但是要收费的哈 但这些都不能指定声
音
转换,所以这里使用声
音
克隆,来将指定人声训练成模型,然后文字转
音
频
。
声音克隆
教程
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和
音
频
生成
视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
解读wav2lip:探究语
音
驱动唇部动作的技术原理!
而且由于生成过程中存在伪影,GAN判别器更容易关注
视
觉伪影,从而忽略
音
频
和口型的对应关系。
wav2lip
语音
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯
音
乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型同步,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
声音
sovits
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
目前AIgc领域正在持续关注,等到年底的时候做一个最全面的
视
频
和文字讲解,现在还是在等等,目前AI领域热度确实是在持续降温,但是呢,深入了解AI的人都知道,AI的发展不是想人一样需要很长时间的积累,有时候可能就是一个算法的突破
Stable
Diffusion
文生图
controlnet
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让
视
频
生成上了一个大台阶,估计是到了AI
视
频
爆发的前夜了。
AnimateDiff
SD
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录
音
和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声
音
、
视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
「语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够同时处理多个
音
频
片段,大幅缩短了从语
音
到文本的转换时间。
Whisper
语音识别
教程
用so-vits-svc-4.1进行
音
色转换的极简教程!
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
so-vits-svc
音色转换
教程
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100