首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 深度体验3天后,我把腾讯这款copilot锁进了程序坞
· 硬核解读Stable Diffusion(系列一)
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
· 换脸软件 FaceFusion 保姆级教程
· 6个最佳开源TTS引擎
· 中文对话大模型BELLE全面开源!(附:数据+模型+轻量化)
· ComfyUI上使用SDXL1.0官方工作流实操使用 零基础讲解节点式生成的Ai绘画工具comfyui,节点模块讲解
· 「长文」可能是目前最全的LangChain AI资源库之一
· 国内厂商语音识别与Whisper评测:现状与概况对比
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Transformer
ViTPose+:迈向通用身体姿态估计的
视
觉Transformer基础模型
如TokenPose等工
作
,使用CNN进行特征提取,并使用transformer
作
为后处理模块来建模多个关键点之间的关系。
ViTPose+
Transformer
身体姿态
OpenAI
Agent:OpenAI的下一步,亚马逊云科技站在第5层
Agent成为最受重
视
的方向。
开源模型
AI写
作
:如何让AI帮你写出10万+标题?
自媒体写
作
中,标题是重中之重。
AI写作
提示词
AI音乐热潮下,“神曲工
作
室”率先失业
短
视
频
的算法“神曲”将最先受冲击 尽管并不认为AI
作
曲能替代所有的人类音乐
创
作
,但梁熠认为,至少对于现在平台上有一些粗制滥造的歌曲,肯定会在AI的挤压下失去生存空间。
音乐
音频
换脸
AI 换脸——Deepfacelab 下载与安装,新手教程
AI 换脸越来越火,换脸的
视
频
到处都是,那种还是那种的都有。
Deepfacelab
换脸
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音
频
克隆声音的黑科技!
CTC 强制对齐(CTC forced alignment) 通过 CTC 强制对齐技术,
创
建精确的单词到音
频
标记的映射。
OuteTTS-0.1-350M
音频
职场及工
作
中常用的方法论总结
做事方法论 5W2H 我们在做一件事时,经常需要和老板或者合
作
方去讲为什么要做这件事,准备怎么做,以求获得来自老板和合
作
伙伴的认可及支持。
工作
OpenAI
【语音识别】OpenAI语音力
作
Whisper
与Wav2Vec 2.0等前
作
不同,以往的模型都是在未标注的音
频
数据上预训练的,而 Whisper 是在大量的已标注音
频
转录数据上预训练的。
语音转文字
whisper
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
在这一系列的博客文章/
视
频
中,我将介绍先进的RAG技术,旨在优化RAG工
作
流程,并解决原始RAG系统中的挑战。
RAG
检索
懒人福音!用AI生成会议纪要,让你的工
作
更高效!
通义听悟主要聚焦于音
视
频
内容,提供多种功能,包括实时语音转写、音
视
频
文件转写、实时翻译、内容标记和智能全文概要等。
会议纪要
AI工具
ChatGPT
字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
前面分享了小悟空、即
创
等字节系列AI
创
作
平台,今天又给大家分享另一个字节的
创
作
平台叫做豆包,体验下来,功能在目前国内算是第一梯队,实用性很强。
AI工具
文生图
将文本转化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
这是一款基于生成式AI的工具,可以将文本提示无缝转换为复杂的3D动画,简化了动画
创
作
过程,同时也超越了物理障碍,使得更多不同类型的
创
作
者和行业可以使用3D动画。
3D
动作捕捉
ComfyUI
再见了ComfyUI,WebUI也有了工
作
流
WebUI以界面美观、功能齐全闻名,而ComfyUI则以效率高、工
作
流便捷著称。
ComfyUI
WebUI
文生图
Prompt
马上掌握这18个Prompts,让你的工
作
效率瞬间暴涨10倍!
你是否感觉每天工
作
很忙,但总是觉得效率低下?
开源模型
语音
解读wav2lip:探究语音驱动唇部动
作
的技术原理!
生成器网络负责生成逼真的嘴唇动
作
,而判别器网络则负责评估生成的嘴唇动
作
的一致性和真实性,通过不断的训练和反馈,生成器网络逐渐学习到如何根据音
频
特征生成与之匹配的嘴唇动
作
。
wav2lip
语音
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100