文章列表-AI魔法学院

文章列表

开源大语言模型完整列表

VisualGLM-6B —— 多模态对话语言模型 VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于 ChatGLM-6B，具有 62 亿参数；图像部分通过训练

开源模型大语言模型

检索增强生成(RAG)有什么好的优化方案？

2）多模态RAG（文本+表格+图片）对多模态RAG而言，有三种技术路线[10]，见下图：图7 多模态RAG 如图7所示，对多模态RAG而言有三种技术路线，如下我们做个简要说明： ·&ensp

RAG 检索增强

说真的，SDXL究竟藏着多少秘密，也许没人知道

探索功能，线上部署，更新工作流……我只想告诉你，SDXL不是一个绘图模型那么简单，在它里面，隐藏着太多不为人知的秘密。

文生图

SeaTable 一站式助力高校多场景数字化升级，打造高效解决方案

已经在多所知名高等教育机构中得到应用和肯定。

大模型

AI绘画：stable difussion SD插件之无限抽卡神器 dynamic prompts（动态提示词）

今天带来抽卡神器：dynamic prompts（动态提示词）插件可以大幅提升抽卡的效率，结合前面的提示词合集让我们开启无限抽卡之旅吧！

AI图片

摆脱 OpenAI 依赖，8 分钟教你用开源生态构建全栈 AI 应用

摆脱对 OpenAI 的依赖，借助开源生态系统构建出全流程的 AI 应用，现在开始！

开源模型

StableDiffusion

深度解析丨StableDiffusion在多个设计场景中的探索与应用

本文将深入解析StableDiffusion在多个设计场景中的探索与应用，尤其关注如何利用其制作多种商业落地案例。

文生图

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

然而，大多数模型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。

GLM-4-Voice 9B 语音安装

斯坦福宣布前端开发要失业了？！一张截图生成代码，64%优于原网页！

随着生成型人工智能（AI）的飞速发展，多模态理解和代码生成的能力达到了前所未有的水平。

设计转代码大模型

Fastwhisper + Pyannote 实现 ASR + 说话者识别

whisper很变态，粤语效果也还不错，因此，如果实际业务中需要涉及到不同的语言，还是更推荐whisper多一点一、faster-whisper简单介绍 faster-whisper是使用

faster-whisper 语者识别 ASR

AI资讯速递 - 快人一步！为你填平AI领域信息差及时揭示AI领域的最新动态

在这个数字化转型的浪潮中，人工智能（AI）的发展速度之快，已经超出了大多数人的想象。

AI资讯 AI新闻

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞 | 可免费体验

第二个，混合不同人物特征，生成全新人物形态。

PhotoMaker 图生图

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

然而，语言模型缺乏像人类一样感知非文本模态（如图像和音频）的能力。

大模型语音

达摩院SPACE对话大模型：知识注入与知识利用

预训练语言模型有了很大的发展，出现了很多变种。

大模型

30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0，微软在 GitHub 上开源了！

微软表示，“如果你想亲自运行 MS-DOS 4.0 软件并进行探索，我们已经成功地在原始 IBM PC XT、较新的 Pentium 电脑以及开源 PCem 和 86box 模拟器上直接运行了该软件。

MS-DOS 4.0 开源模型微软

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1