首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· 从第一性原理看大模型Agent技术
· AI换脸工具:facefusion使用心得
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 40个prompt,让你成为麦肯锡高手
· TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
· Stable Diffusion 30种采样器全解!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视
频
的方法!
它通过各种短视
频
剪辑进行训练。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作视
频
工具
之前介绍过一款图片生成视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作视
频
工具。
Flow
Photo
视频
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
现在登
录
通义App(原通义千问),选择全民演唱功能,只需上传任意一张人物正面大头照,你也能玩儿了。
音频
阿里
教程
用AI做郭德纲说英文相声的爆款视
频
(详细教程)
郭德纲用英文说相声的短视
频
火爆全网,单条视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、视
频
和数据流。
voice
agent
开源
音视频
开源
爆火「视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
比如输入“Chinese ink painting”,风景纪
录
片能秒变国风水墨大作。
ControlNet
Sora
OpenAI Sora视
频
生成模型技术报告中英全文+总结+影响分析
•目前当红的短视
频
推荐的形态可能会发生改变——从系统根据用户喜好推荐短视
频
,变成针对性生成短视
频
?
sora
openai
视频生成
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视
频
实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜视
频
。
Bert-vits
语音
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生成开发框架
在过去的几年里,我们看到了AI在图像、视
频
和文本生成方面的巨大进步。
开源模型
Roop参数说明,ROOP->StyleGAN演示!
因为这个视
频
刚好有很多张脸,然后又是多角度60帧4K的动态视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
数字人
AI虚拟主播数字人技术实现Wav2Lip
AI蒙娜丽莎虚拟数字人-虚拟主播 本文目
录
第一部分:深度伪造技术概述 第二部分:Wav2lip技术概述 第三部分:使用Wav2Lip进行AI主播虚拟人的深度实践 第四部分:效果评测 第五部分
数字人
视频
开源
从声纹模型到语音合成:音
频
处理 AI 技术前沿 | 开源专题 No.45
facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于音
频
生成的
AudioCraft
音频
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视
频
,还可在端侧部署
总参数量 8B,单图、多图和视
频
理解性能超越了 GPT-4V。
minicpm
面壁
Sora
快手版Sora「可灵」开放测试:生成超120s视
频
,更懂物理,复杂运动也能精准建模
与视
频
一同曝光的,是一款名为「可灵」全新国产视
频
生成大模型。
可灵
快手
文生视频
RAG
LangChain - RAG:线上系统多文档要
频
繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...
LangChain 提出的方案如下图所示,暂且称它为「增量更新」模式,在 data-transform 这一步、embedding 之前针对没个 chunk 做一次 hash,记
录
下来 hash 值,每次源数据更新了只需要在这一步里面比对一下
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100