文章列表-AI魔法学院

文章列表

OmniVision - 968M：小巧精悍的视觉语言模型，释放多模态边缘计算强大潜能

边缘设备，如智能手机、物联网设备等，对智能处理视觉和文本信息的需求也在急剧增长。

OmniVision -968M 多模态模型

厉害了，匹诺曹Pinokio！所有AI工具，一键安装，全部免费！整合AI绘画、AI视频、AI语音...

涵盖了 AI 绘画、AI 视频、AI 音乐、AI 数字人等各个领域今天给大家推荐一款AI神器，匹诺曹Pinokio！

AI绘画 AI视频 AI音乐

阿里RAG新框架R4：增强检索器-重排序-响应器，5个知识密集任务上都超过Self-RAG等！

尽管检索增强的LLMs通过检索外部数据来减少这种幻觉，但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互，这在处理长文档时尤其影响回答的准确性。

RAG 检索大型语言模型

Sora懂不懂物理世界？

Sora的基本原理 Sora的训练集为短视频集，每个样本是一个短视频，Sora将其编码到数据空间进行降维，然后在隐空间中将特征向量切割成补丁，加上时间顺序，构成时空补丁，亦即时空令牌（time-space

文生视频视频生成 sora

Ollama 与 Dify：AI 应用开发的强强联合

介绍随着大型语言模型（LLM）的快速发展，它们为 AI 应用开发提供了强大的功能和灵活性。

Ollama Dify 大型语言模型

15种ChatGPT高频用法

本文列出了15个可以高频使用chatgpt以及其他大模型的场景，希望对您会有启发

大模型效率

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

它集成了先进的语音增强（Speech Enhancement）、语音分离（Speech Separation）和音视频扬声器提取（Audio-Video Speaker Extraction）功能，能够在嘈杂环境中清理音频

ClearerVoice-Studio 语音

Langchain中改进RAG能力的3种常用的扩展查询方法

有多种方法可以提高检索增强生成(RAG)的能力，其中一种方法称为查询扩展。

检索增强生成 Langchain

爆火的“女孩的一生”，plus版教程它来了

嘿，动画和视频制作的小伙伴们，今天我们来聊聊怎样用animatediff和LCM（Lower Complexity Model）来制作超炫酷的视频。

动画视频 AnimateDiff

动画制作工具AnimateDiff用法详解

AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。

AnimateDiff 视频训练

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

我第一次发现LobeChat的时候，就是看到那炫酷的页面，这么强的前端真的是在秀肌肉啊！

AI开源集合

TTS，一个奇妙的AI工具

在自媒体盛行的今天，很多人尝试制作视频发到自媒体平台上，通过获得流量的方式实现直接或间接变现。

TTS 文本转语音

LLM之RAG实战（五）| 高级RAG 01：使用小块检索，小块所属的大块喂给LLM，可以提高RAG性能

RAG（Retrieval Augmented Generation，检索增强生成）系统从给定的知识库中检索相关信息，从而使其能够生成事实信息、上下文相关信息和特定领域的信息。

RAG 检索

郭德纲讲英语相声详细教程

郭德纲用英文说相声的短视频火爆全网，同类型的AI短视频层出不穷，更有好莱坞明星说中文的短视频，不断地出爆款，那么现在我们就开始学习如何制作一个同类型的AI短视频吧！

数字人音视频

Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰

无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作，Wunjo AI 都能满足您的需求。

AI语音克隆实时语音识别

<...2 3 4 567 8 9 10 11 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1