文章列表-AI魔法学院

文章列表

角色，背景，任务，产出内容与形式：如何写出优雅的prompt？ - 通用的万能框架

在ChatGPT3-Free-Prompt-List的项目上，他总结了一套prompt的方-法-论框架。

提示词 prompt

基于大模型（LLM）的Agent 应用开发

这种流程的潜在设计空间可能是巨大而复杂的，《如何构建基于大模型的App》一文给出了一种探索中的大模型应用开发基础框架，基本可以适用于RAG 和Agent。

大模型 Agent

AIGC工具提示词技巧

比如写一篇命题作文，或者回答一个政治题，用什么样的框架、什么样的方向、什么样的开场，内容如何填充，用怎样的结构性语言？

AIGC 提示词

[开源]面向中小团队的轻量化知识管理应用，构建知识库和知识社区

二、开源协议使用BSD-3-Clause开源协议三、界面展示产品截图四、功能概述 “知了”以知识管理的全生命周期为核心，围绕知识的分享再利用，构建中小团队的知识库和知识分享社区

大模型

LangChain Agent 原理解析

LangChain 是一个基于 LLM（大型语言模型）的编程框架，旨在帮助开发人员使用 LLM 构建端到端的应用程序。

大模型

你要牢记的四个常用AI提示词框架：ICIO、CRISPE、BROKE、RASCEF，有助于获取更加稳定和高质量的内容

ICIO 框架 ICIO 框架主要关注任务的明确性和输出的格式，它特别适用于那些需要明确指导 AI 完成特定任务的场景。

大模型提示词

检索增强生成 (RAG):What, Why and How?

检索增强生成（简称 RAG）是 Meta 于 2020 年推广的一种架构，旨在通过将相关信息与问题/任务细节一起传递给模型来提高 LLM 的性能。

检索增强大模型

【分享】SDXL模型最佳拍档！COMFY UI上手指南

SDXL 1.0 特点建立在由 3.5B 参数BASE模型和 6.6B 参数REFINE模型组成的两阶段创新架构之上。

大模型

OCR终结了？旷视提出可以文档级OCR的多模态大模型框架Vary，支持中英文，已开源！

通过 LLM 极强的语言先验，这种架构还可以避免 OCR 中的易错字，比如“杠杆”和“杜杆”等，对于模糊文档，也有望在语言先验的帮助下实现更强的 OCR 效果。

OCR 手写文字识别

阿里通义实验室薄列峰：从兵马俑跳“科目三”到照片唱歌，四大框架让AI生成的人物活起来丨GenAICon 2024

四大框架玩转AI人物视频生成，已落地通义千问APP。

通义文生视频

新模型Cascade你真的用对了吗？！

Cascade 模型最大的优点是 § 是能生成带有文字的图片，文字出错率相比以前模型少很多； § § 其次是硬件要求降低，甚至与sd1.5相比，该架构比之前版本实现了

Stable Cascade 模型

RAGFlow：开源的RAG引擎，专注于深入的文档理解，支持处理各种复杂格式的非结构化数据

支持处理各种复杂格式的非结构化数据，包括文本、图片、扫描副本、结构化数据和网页等。

RAGFlow RAG 开源

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

因此，市场急需一套能够应对这些挑战并适应现代应用需求的语音处理框架，例如虚拟助手、视频会议和创意媒体制作。

ClearerVoice-Studio 语音

4秒惊艳！Stable Cascade AI绘画神器，设计师和普通用户的无限创意新选择

任何人都可以在Stability的GitHub页面上找到用于微调、ControlNet和LoRA训练的脚本，进一步挖掘这个全新架构的潜力。

文生图绘画

OmniVision - 968M：小巧精悍的视觉语言模型，释放多模态边缘计算强大潜能

在此背景下，OmniVision - 968M模型应运而生，它以紧凑的架构、创新的技术设计，为边缘设备的多模态智能应用带来了新的曙光。

OmniVision -968M 多模态模型

<...3 4 5 678 9 10 11 12 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1