首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 必看!阿里通义千问完整技术报告
· MCP服务介绍及应用场景报告-来自Manus
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 实测:本地跑llama3:70B需要什么配置
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion教程:提示词
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 爆火的“女孩的一生”,plus版教程它来了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段音
频
和一个视
频
,PersonaTalk便能精准同步人物的口型,不仅让声音和嘴型无缝贴合,还能保留视
频
中人物的表情和个性化说话风格,仿佛原生发声一般自然流畅。
PersonaTalk
视频
Sora
快手版Sora「可灵」开放测试:生成超120s视
频
,更懂物理,复杂运动也能精准建模
与视
频
一同曝光的,是一款名为「可灵」全新国产视
频
生成大模型。
可灵
快手
文生视频
开源
从声纹模型到语音合成:音
频
处理 AI 技术前沿 | 开源专题 No.45
facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于音
频
生成的
AudioCraft
音频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型视
频
的时候,会有一种割裂感。
Loopy
视频
工具
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视
频
、AI语音...
涵盖了 AI 绘画、AI 视
频
、AI 音乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
阿里
阿里最近推出AI项目的动作太过
频
繁,脑子跟不上了,事出反常必有妖,盘点一下
一个静态图片转视
频
的项目。
阿里
大模型
RAG
LangChain - RAG:线上系统多文档要
频
繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...
LangChain 提出的方案如下图所示,暂且称它为「增量更新」模式,在 data-transform 这一步、embedding 之前针对没个 chunk 做一次 hash,记
录
下来 hash 值,每次源数据更新了只需要在这一步里面比对一下
大模型
Github
GItHub一款强大、简单、易用的高效的数据处理RPA小工具
还可以
录
屏帮你自动化。
GitHub
数据处理RPA
下载
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视
频
、图像、文件等!
2.全网视
频
下载:AixDownloader不仅能抓图,还能抓视
频
!
AixDownloader
下载
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动图
这是一个AnimateDiff介绍教程,这个工具可让您使用Stable Diffusion创建令人惊叹的 GIF 动画,这是目前为止最好的文本生成视
频
(Text-to-video)人工智能工具之一。
AnimateDiff
视频
训练
Sora
通俗易懂地解释OpenAI Sora视
频
生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
Sora生成的视
频
与此前其它平台生成的视
频
到底有哪些区别?
sora
视频生成
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
而这一次的项目,就是被N多人期待了很久的,腾讯混元视
频
生成模型。
sora
视频生成
数字人
AI虚拟主播数字人技术实现Wav2Lip
AI蒙娜丽莎虚拟数字人-虚拟主播 本文目
录
第一部分:深度伪造技术概述 第二部分:Wav2lip技术概述 第三部分:使用Wav2Lip进行AI主播虚拟人的深度实践 第四部分:效果评测 第五部分
数字人
视频
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在音
频
驱动的视
频
生成领域,制作普通话视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、
录
音和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声音、视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100