文章列表-AI魔法学院

文章列表

比真人还像真人！字节跳动PersonaTalk的黑科技有多强大？

只需提供一段音频和一个视频，PersonaTalk便能精准同步人物的口型，不仅让声音和嘴型无缝贴合，还能保留视频中人物的表情和个性化说话风格，仿佛原生发声一般自然流畅。

PersonaTalk 视频

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

与视频一同曝光的，是一款名为「可灵」全新国产视频生成大模型。

可灵快手文生视频

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于音频生成的

AudioCraft 音频

数字人起飞！字节Loopy对口型功能在即梦上线可根据语境匹配表情和情绪

以往，对口型视频往往存在一个通病，那就是看似嘴型对上了，但总感觉这个声音不是他发出来的，以至于大家看对口型视频的时候，会有一种割裂感。

Loopy 视频

厉害了，匹诺曹Pinokio！所有AI工具，一键安装，全部免费！整合AI绘画、AI视频、AI语音...

涵盖了 AI 绘画、AI 视频、AI 音乐、AI 数字人等各个领域今天给大家推荐一款AI神器，匹诺曹Pinokio！

AI绘画 AI视频 AI音乐

阿里最近推出AI项目的动作太过频繁，脑子跟不上了，事出反常必有妖，盘点一下

一个静态图片转视频的项目。

阿里大模型

LangChain - RAG：线上系统多文档要频繁更新，每次都要重新花钱做一次 embedding，老板不批预算，批我...

LangChain 提出的方案如下图所示，暂且称它为「增量更新」模式，在 data-transform 这一步、embedding 之前针对没个 chunk 做一次 hash，记录下来 hash 值，每次源数据更新了只需要在这一步里面比对一下

大模型

GItHub一款强大、简单、易用的高效的数据处理RPA小工具

还可以录屏帮你自动化。

GitHub 数据处理RPA

绝对是你的下载神器！AixDownloader可让你从任何网页下载你想要的内容，音乐、视频、图像、文件等！

2.全网视频下载：AixDownloader不仅能抓图，还能抓视频！

AixDownloader 下载

Stable Diffusion

AnimateDiff：一篇文章教你学会用Stable Diffusion制作GIF动图

这是一个AnimateDiff介绍教程，这个工具可让您使用Stable Diffusion创建令人惊叹的 GIF 动画，这是目前为止最好的文本生成视频（Text-to-video）人工智能工具之一。

AnimateDiff 视频训练

通俗易懂地解释OpenAI Sora视频生成的特点有哪些？它与此前的Runway Gen2、Pika有什么区别？以及缺点是什么？

Sora生成的视频与此前其它平台生成的视频到底有哪些区别？

sora 视频生成

腾讯悄悄开源混元版「Sora」，这就是开源领域的No.1。

而这一次的项目，就是被N多人期待了很久的，腾讯混元视频生成模型。

sora 视频生成

AI虚拟主播数字人技术实现Wav2Lip

AI蒙娜丽莎虚拟数字人-虚拟主播本文目录第一部分：深度伪造技术概述第二部分：Wav2lip技术概述第三部分：使用Wav2Lip进行AI主播虚拟人的深度实践第四部分：效果评测第五部分

数字人视频

京东开源普通话数字人JoyHallo，一口流利标准普通话还会讲英语

在音频驱动的视频生成领域，制作普通话视频面临着许多挑战。

JoyHallo 数字人开源模型

被高估的Pika，被低估的多模态AI

例如，在医疗领域可以通过结合图像、录音和病历文本，提供更准确的诊断和治疗方案；在交通领域，结合图像和传感器数据，带来更智能、更安全的自动驾驶体验；在教育领域，将文本、声音、视频相结合，呈现更具互动性的教育内容

大模型多模态

<1 2 3 456 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1