文章列表-AI魔法学院

0基础！动手部署Qwen1.5-MoE模型！能力如何？API接入fastgpt等任何应用！喂饭到嘴教程，附模型下载！

本文介绍了moe模型的开发背景及优势，特别强调了新发布的Qwen1.5-MoE-A2.7B模型的能力超过7B，具有推理速度快、部署成本低的特点。文章还通过一系列问题测试了该模型的能力，并详细描述了如何在本地部署该模型，包括所需算力、环境配置、模型下载等步骤。最后，文章提到模型权重和推理仓库的下载方式，但仅限特定会员专享。

Qwen1.5-MoE 大模型下载 2024-05-22

【提前体验GPT-5】吴恩达AI智能体工作流详细解读

吴恩达教授提出AI智能体驱动的工作流方式将成为未来趋势，并证实通过此技术GPT3.5的效果可超越GPT4。他在斯坦福大学的演讲中详细解释了四种实现智能体工作流的设计模式：反思、使用工具、规划和多智能体协作。反思模式涉及让智能体检查并优化其工作；使用工具模式强调智能体依赖外部工具提升能力；规划模式要求智能体预先规划执行路径；多智能体协作模式则涉及智能体间的角色扮演和辩论以提升性能。这些模式将大幅扩展AI的功能。尽管智能体工作流需要时间来生成答案，但快速生成token的技术研究也在兴起。在使用智能体工作流时，需要保持耐心。

GPT-5 智能体 2024-05-22

老板：这龙谁做的？我：AI

2024龙年将至，文章分享了四组以龙为主题的关键词，涵盖不同风格与元素，如后启示录废墟、金绿配色、青色霓虹及女孩与白龙等，每组关键词均可生成独特效果图片，建议多次尝试以选到满意作品。

V6模式文生图关键词 2024-05-22

知乎

弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书

研究团队使用充满荒谬、离奇言论的中文社区“弱智吧”的数据训练AI模型，该模型在多项测试中表现卓越，甚至超过了使用其他平台数据训练的模型。研究团队认为，这种数据增强了AI的逻辑推理能力。此研究为中文大模型开发提供了有价值的指令微调数据集，展现了社交媒体数据在AI训练中的潜力。

弱智吧训练数据集 2024-05-22

数字人

开源！数字人资源大集合！

本文介绍了完整数字人项目及其资源合集，包含数字人相关的大量论文和源代码。文章列举了多个团队与人员的研究成果，以及相关的数据集，如SMPL、THUmanDataset和AGORA等。此外，还介绍了3D人体头像生成和动画以及穿衣人体运动生成等方面的研究进展，包括使用文本生成可动画的数字化身和具有高效3D铰接人体生成的技术。同时，文章还涉及了穿衣人数字化的研究，包括从单目图像恢复3D人体网格的方法以及具有镜像意识的神经人类等。最后，文章提及了智能手机视频中的逼真虚拟人技术，以及使用隐式表面对应和自监督学习进行3D人体网格配准的方法。

数字人开源 2024-05-21

SQL

微信为什么使用 SQLite 保存聊天记录？

本文介绍了SQLite作为一个被低估但功能强大的数据库，尽管没有网络层，但适用于多种场合。文章重点讨论了SQLite在2018年新增的SQL功能，包括布尔字面量和判断、窗口函数、Filter子句、Insert … on conflict (“Upsert”)、重命名列等。SQLite支持布尔值判断，窗口函数功能领先业界，Filter子句提供更易理解的聚合过滤方式，Upsert功能优雅处理主键和唯一约束冲突，并引入重命名列功能。此外，还提到了SQLite在API方面的一些变化。总之，SQLite在不断完善其SQL功能，成为一个可靠且广泛应用的数据库引擎。

SQLite 微信数据库 2024-05-21

AI绘画：InstantID Win11本地安装记录！

本文介绍了InstantID项目的在线体验与本地安装记录。作者先表达了等待的焦虑，随后详细记录了从准备工作到安装依赖、下载模型，再到运行测试的整个流程。文中还提到了在安装过程中遇到的网络问题、缺少chardet模块以及下载antelopev2模型失败等挑战，并给出了相应的解决方法。作者还表示正在等待新的更新，并计划发布一键运行包。最后，作者询问了是否有降低显存的方法，以实现在8G显存上运行的需求。

InstantID Win11 安装 2024-05-21

Github

经典Prompt欣赏 - GitHub Copilot Chat

本文介绍了GPT作为AI编程助手的功能与限制，强调其专注于软件开发领域并遵守微软内容政策。列出了AI助手能执行的任务，如查询文件、解释代码工作原理、生成单元测试等。同时提及用户使用的IDE环境Visual Studio Code及其特点。文章还强调了在使用GPT时，应逐步思考并详细描述计划，以提升回答的准确性。

prompt 提示词 2024-05-21

社区供稿｜GPT-4 与国产模型，大！横！评！

本文测评了三款国产大模型——智谱GLM-4、文心一言4.0和字节的豆包，以GPT-4为基准，通过基础测试和应用实践两个环节来评估它们的性能。在基础测试中，各模型在联网查询、数据分析、多模态文生图、长文档解读以及智能体等方面的表现各有千秋。智谱GLM-4在各项功能上表现稳定，与GPT-4的功能布局相似，但在智能体功能上稍逊于GPT-4。文心一言4.0在数据分析方面存在不足，但在高考数学大题等场景下表现出色。字节的豆包在语义理解和常识查询方面表现突出，但在其他功能上还有待提升。在应用实践中，各模型在文本生成、语义理解、数理计算和代码解释等方面的表现也各具特色。智谱GLM-4在多个场景下表现稳定，尤其在数理计算和代码解释方面表现突出。文心一言4.0在高考数学大题上得分较高，但在代码解释方面表现不佳。字节的豆包在常识查询方面表现出色，但在其他场景下的表现平平。此外，文章还对比了智谱GLM-4与其上一代模型GLM-3的性能差异，显示出GLM-4在各项基础模型能力上的全面强化和进步。最后，文章指出，虽然ChatGPT等国外大模型在技术上具有优势，但在本地化表现上并不尽如人意，对于中文普通用户而言仍存在使用门槛。国产大模型在努力提升技术实力的同时，也需关注本地化需求和用户体验，以更好地满足国内用户的需求。

GPT-4 大模型 2024-05-21

教程

SD入门教程三：采样器及参数调整

本文详细讲解了文生图模块下采样器和各种参数对生成图片细节的影响。文章介绍了不同采样方式的出图效果、迭代步数的选择、人物修复插件的使用、高分辨率修复技巧，以及宽度和高度、生成批次和每批数量、提示词引导系数、随机种子和模板区域操作等参数的调整方法。通过精确调整这些参数，可以实现对图像生成质量和风格的精细控制，创造出高质量且风格统一的图像作品。

SD 入门教程 2024-05-20

国产AI，逃过一劫

文章简要概括了去年ChatGPT的崛起引发的国内大模型创业潮，以及随后行业的冷静和商业化进程。特别关注了美团联合创始人王慧文在此过程中的起伏，包括他高调宣布进军AI赛道，设立光年之外科技有限公司，但随后因个人原因退出，并将光年之外并入美团。文章还提到了王慧文近期作为投资人和创始股东参与硅动科技的创业，该公司致力于解决大模型推理和部署的高成本问题。此外，文章还分析了国内大模型行业的发展趋势，包括从追赶ChatGPT到注重应用场景落地，以及面临OpenAI等国外巨头的竞争压力。最后，文章对王慧文回归AI赛道的未来表现持观望态度。

ChatGPT 大模型 2024-05-20

Prompt

prompt提示工程最佳实践课程笔记分享

本文总结了使用大型语言模型进行应用开发时的六个技巧：撰写清晰具体的指令，给模型足够的思考时间，重复提问以确定最佳答案，引导模型处理复杂问题，分解任务或指令，以及利用外部工具提升模型能力。这些技巧有助于提高模型回答的准确性和效率，对应用开发具有指导意义。

prompt 提示词 2024-05-20

医疗

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

顶尖学者合作推出交互式代理基础模型，具备处理文本、图像、动作输入的多模态能力，可应用于机器人、游戏、医疗等多领域。模型具有实时判断和多模态处理能力，利用预训练子模块和游戏数据集提升性能，实现精准预测和强适应性。该模型为通用、行动导向的AI应用提供了有希望的途径，作者将开源项目代码。

Agent+GPT-4V 大模型 2024-05-20

微软

微软、OpenAI大佬暗示LLM应用开发范式迁移：从Prompt Engineering到Flow Engineering

《Code Generation with AlphaCodium》论文提出Flow engineering范式，通过多次生成测试反馈迭代提升GPT-4准确率。文章指出，未来LLM应用开发应重视Flow engineering，从单次prompt工程转变为基于环境反馈的复杂流程组织及自我迭代纠错。文章还强调了大模型应用开发的务实性和工程化，并提及了多个MultiAgent框架和平台，反映了MultiAgent在LLM时代的重要性。

LLM 范式迁移 2024-05-20

Stable Diffusion

回来啦｜ Stable Diffusion 图片背景完美替换

本文介绍了使用Stable Diffusion实现图片背景完美替换的方法，包括通过rembg插件获取图片主体蒙版、图生图重绘蒙版进行背景重绘，以及利用ControlNet深度模型优化景深效果。适用于广告产品图、头像背景替换等场景。

Stable Diffusion 文生图 2024-05-20