首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· SD入门教程六:ControlNet基础入门
· 大语言模型的拐杖——RLHF基于人类反馈的强化学习
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· Stable Diffusion使用Roop插件一键换脸教程
· 10秒换脸,一张图片够了!SD Roop插件教程
· 九个让你成为GPT提示高手的提示词框架
· 大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 会“追问”的Agent,大模型知识库另类实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频魔法
Roop参数说明,ROOP->StyleGAN演示!
Roop参数说明,ROOP->StyleGAN演示!
视频
StyleGAN
2023-11-20
2023-11-20
开源
开源本地化部署的「妙鸭相机」,真的要革了「海马体」们的命了?|手把手教你搭建「妙鸭相机」
【新智元导读】EasyPhoto作为妙鸭相机平替,有着不输妙鸭相机的生成质量,还有更好的定制化空间和本地部署的优势。
训练
2023-11-15
2023-11-15
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
2023-11-14
2023-11-14
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
2023-11-13
2023-11-13
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视频火爆全网,同类型的AI短视频层出不穷,更有好莱坞明星说中文的短视频,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视频吧!
数字人
音视频
2023-11-03
2023-11-03
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法
今天给大伙分享一下目前来看比较稳定的文本生视频的插件 AnimateDiff。之前虽然小视频生成比较火,不过出的视频都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
2023-10-20
2023-10-20
数字人
教你用StableDiffusion设计AI数字人
随着Diffusion(扩散算法)的异军突起,AIGC(AI Generate Content)让曾经在脑海里的想象快速地成为具体的画面,每个人拥有自己的数字分身还是只存在电影或者小说里的桥段吗?虚拟偶像AYAYI、虚拟品牌代言人“花西子”、美妆数字达人柳叶熙、新华社AI合成主播-新小浩…技术新潮下数字人层出不穷。 但,普通人能有自己的数字分身吗?
文生图
2023-09-26
2023-09-26
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音频可以生成,而用自己的图片、音频生成视频就不行。 基本都是因为图片分辨率太高,或者音频格式不对。 下面是解决方法:
SadTalke
2023-08-13
2023-08-13
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
本教程将介绍如何使用Stable Diffusion和Sadtalker结合起来,实现从文本到视频的生成。学会本教程之后,大家就可以在自己的电脑上免费用一张图片生成数字人口播视频
数字人
2023-07-22
2023-07-22
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲。so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一种结合变分推理(variational inference)、标准化流(normalizing flows)和对抗训练的高表现力语音合成模型
音乐
2023-06-08
2023-06-08
人工智能
6个AI音乐软件推荐,让你学会人工智能AI作曲
跟AI绘画一样,音乐产业正在将AI作为一种辅助工具,而不是代替人类艺术家。人工智能(AI)正在越来越多地应用于音乐、电影和绘画等艺术领域。在当下的应用中,AI已经可以影响音乐制作过程的各个方面,包括音乐生成、音频掌握等。
训练
音乐
2023-05-31
2023-05-31
大模型
AI里的大模型,你了解么
AI大模型是“人工智能预训练大模型”的简称,是指具有大量参数和复杂结构的机器学习模型。这些模型可以应用于处理大规模的数据和复杂的问题。包含了“预训练”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。
人工智能
2023-05-31
2023-05-31
开源
语音、视频转文字神器:开源whisper介绍
Whisper是OpenAI的一个项目,旨在通过大规模的弱监督学习来实现语音识别。这种方法使用大量的未标注语音数据和一些已标注的数据来训练一个深度学习模型,从而自动学习如何从语音信号中提取特征并将其转换为文本。Whisper的特点是速度快、准确性高,并且可以处理各种各样的语音信号,包括噪音、口音和语速等。该项目旨在为那些缺乏手动标注数据的语言学家和工程师提供一种新的工具,以帮助他们实现更高效的语音识别。
人工智能
大模型
wisper
2023-05-30
2023-05-30
开源
开源免费离线语音识别神器whisper如何安装
Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识(Automatic Speech Recognition,ASR)模型是被训练来运行语音辨识与翻译任务的,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。
wisper
翻译
免费
2023-05-28
2023-05-28
<
1
2
3
4
5
6
7
8
>
1
2
4
5
6
7
8
9
100