首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 国内外开源大语言模型一览表
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· OCR的终极解法——传统算法VS多模态大模型
· 一款构建AI数字人项目开源了!自动实现音视频同步!
· 换脸软件 FaceFusion 保姆级教程
· LangChain + ChatGLM2-6B 搭建私域专属知识库
· 大模型+人形机器人,是不是下一个风口?
· ComfyUI上使用SDXL1.0官方工作流实操使用 零基础讲解节点式生成的Ai绘画工具comfyui,节点模块讲解
· 终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频制作
被高估的Pika,被低估的多模态AI
在行业主语为“落地”的当下,多模态 AI 正走向场景化、实用化、商业化。例如,在医疗领域可以通过结合图像、录音和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声音、视频相结合,呈现更具互动性的教育内容。 但是业界一直在提多模态的概念,远没有近期几个现象级产品的演示那么直观:多模态不仅可以为 AI 应用带来更多可能性,还是实现通用人工智能的重要路径。
大模型
多模态
2024-01-03
2024-01-03
教程
爆火的“女孩的一生”,plus版教程它来了
嘿,动画和视频制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model)来制作超炫酷的视频。忘掉那些老派的制作方法吧,我们这里有新鲜出炉的黑科技!
动画
视频
AnimateDiff
2024-01-02
2024-01-02
工具
TTS,一个奇妙的AI工具
TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天,很多人尝试制作视频发到自媒体平台上,通过获得流量的方式实现直接或间接变现。有部分人天生能说会道,全靠一张嘴,能完成整个视频。但大多数人,很难一次性的流畅表达一个主题,往往需要在制作视频时加入配音。
TTS
文本转语音
2023-12-27
2023-12-27
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视频插件库
AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像生成过程,生成一系列与训练视频剪辑相似的图像。简言之,AnimateDiff通过训练大量短视频来优化图像之间的过渡,确保视频帧的流畅性。
动画
视频
AnimateDiff
2023-12-19
2023-12-19
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核心都是人物口型与音频中的语音唇形同步)。主要通过将两个不相关的人的视频、音频,采用Wav2Lip技术,最终得到一个完整的视频文件,且视频的人物口型与音频内容一致。
数字人
视频
2023-12-19
2023-12-19
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视频插件
AnimateDiff通过控制模块优化Stable Diffusion模型,利用短视频剪辑训练生成相似图像序列,确保视频帧流畅。与传统SD模型训练不同,AnimateDiff通过短视频训练提高图像连续性,生成高质量短视频。
动画
视频
AnimateDiff
2023-12-14
2023-12-14
语音
「语音识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语音识别模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。作为Whisper模型的蒸馏版,Distil-Whisper凭借轻量级架构和卓越的处理速度,成为了技术热潮中的新宠。那么,这个被誉为“语音识别的未来”的AI工具到底有何过人之处?让我们一探究竟。
Distil-Whisper
语音识别
2023-12-12
2023-12-12
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法!
今天给大伙分享一下目前来看比较稳定的文本生视频的插件 AnimateDiff。 之前虽然小视频生成比较火,不过出的视频都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
2023-12-11
2023-12-11
视频
开箱即用的图像增强、视频增强AI工具,Upscapl、Topaz Video AI
图像和视频领域使用较多的AI工具,免安装,无需会员,开箱即用! Upscapl专注于图像增强、图片放大;Topaz Video AI专注于视频画质提升、防抖、补帧、慢放等;软件下载链接详见功能介绍,快来试试吧!
图像增强
视频增强
2023-12-11
2023-12-11
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。
Bert-vits
语音
2023-12-08
2023-12-08
视频
用AI做郭德纲说英文相声的爆款视频(详细教程)
郭德纲用英文说相声的短视频火爆全网,单条视频点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把视频翻译成30+种语言,丝滑程度,随时能把生意做到全世界!
视频
翻译
语言
2023-12-07
2023-12-07
开源
人脸识别的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸识别算法和工具。它支持多种编程语言,包括Python、C++、Java等。
人脸识别
开源项目
2023-12-07
2023-12-07
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
使用 Wunjo AI 解锁神经网络无与伦比的功能。无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
2023-12-06
2023-12-06
语音
国内厂商语音识别与Whisper评测:现状与概况对比
随着人工智能技术的飞速发展,语音识别已经成为了现代社会中一个重要的研究领域。语音识别技术不仅可以应用于智能助手、语音控制、自动化客服等领域,还有望为残障人士提供更便捷的沟通工具。国内的科技企业在语音识别领域也在不断迭代和创新,其中不乏一些具有竞争力的语音识别技术,如讯飞、百度、阿里巴巴等,这些厂商的技术在一定程度上已经接近或达到了国际领先水平。同时,Whisper(飞思卡尔语音识别技术)作为一项国际上也备受关注的语音识别技术,在语音识别领域也有着广泛的应用。Whisper技术在噪声环境下依然能够准确识别并理解语音指令,因此在汽车、智能家居等领域有着广 ...
语音识别
Faster-Whisper
2023-12-04
2023-12-04
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让视频生成上了一个大台阶,估计是到了AI视频爆发的前夜了。其实这两天也在轮流学习使用WebUI和ComfyUI,发现同等帧率设置下ComfyUI的生成速度要快很多而且占用资源少一些,但是不知道是不是心理原因总感觉ComfyUI的清晰度不如WebUI,所以相对来说WebUI玩的更多一些(其实主要还是因为简单,ComfyUI研究一晚上只造出了基础的生成和放大流程o(╥﹏╥)o),下面还是分享一些在使用WebUI方面的遇到的问题或小技巧
AnimateDiff
SD
2023-12-04
2023-12-04
<
1
2
3
4
>
1
2
4
5
6
7
8
9
100