文章列表-AI魔法学院

文章列表

回望做大模型一年后的感悟

本文总结了AI领域的多个观点，包括OpenAI的稳定性问题、大模型领域的进步、开源与闭源的差距、LLaMA对大模型生态的影响以及中国研究者的实力。文章认为，尽管OpenAI在某些方面领先，但并非稳如泰山；国内在大模型领域的进步显著，且部分研究者的实力超过外界预期。同时，文章也指出了开源与闭源之间的差距，并强调了数据在模型训练中的重要性。最后，文章对中国在AI领域的发展充满期待。

大模型感悟 2024-05-24

吴恩达老师建议大家关注 AI 智能体工作流

吴恩达老师强调关注AI智能体工作流，可显著提升AI应用性能。他总结了一套智能体设计模式，包括反思、使用工具、规划及多智能体合作。通过迭代处理和多智能体协同，AI能产生更优质成果。近期研究也显示，采用迭代智能体工作流可大幅提升AI性能。未来将深入探讨这些设计模式并提供相关阅读材料。

智能体大语言模型 2024-05-24

AI国力战争：GPU是明线，HBM是暗线

本文指出，随着AI技术的迅猛发展，算力已成为国家竞争力的重要体现。当前，全球范围内在AI算力领域的竞争日趋激烈，大模型和GPU作为算力核心，备受关注。然而，在这场竞争中，HBM（高带宽内存）作为关键一环，却往往被忽视。 HBM是DRAM的一种升级产品，基于3D堆栈工艺，可以实现更高的内存带宽和更低的能耗，完美契合大模型对数据量和算力的近乎无上限需求。然而，HBM市场高度垄断，主要由韩国的海力士和三星主导，这使得其他国家在HBM供应上面临高风险。随着AI基础算力需求的大爆发，HBM供应紧张，价格高昂，成为制约AI算力进一步发展的瓶颈。文章强调，从2024年起，HBM将继GPU之后成为各个国家在算力竞争的关键。目前，韩国在HBM领域遥遥领先，美国虽有独苗美光科技苦苦支撑，但与中国相比仍具优势。而中国在HBM产业链上的存在感尚弱，国内尚无法量产HBM，这成为国内自研AI芯片的重大隐忧。为了突破这一困境，文章提出了两条投资逻辑：一是参与全球HBM产业链，选择能够参与到全球HBM供应链中的企业；二是相信国产化能够成功，选择可能在HBM封装上发挥作用的上市公司。然而，由于HBM技术难度高、投资金额大，且需要存储厂、晶圆代工厂、封装厂的通力合作，因此国产HBM的突破仍面临诸多挑战。总的来说，本文深入剖析了HBM在AI算力竞争中的关键作用以及全球HBM市场的现状与挑战，强调了国产HBM突破的重要性和紧迫性，为相关企业和投资者提供了有价值的参考。

GPU HBM 大模型 2024-05-23

用GPT4创建一部连环画故事

本文介绍了如何使用在线工具GPTs为孩子创作一本连环画故事书，主题为戒掉电子产品、享受户外活动。故事描述了一个小男孩从沉迷于智能手机到发现户外乐趣的转变过程，包括他如何被外界吸引、参与游戏、享受真实体验，并最终成为鼓励同伴参与户外活动的领导者。这个故事旨在提醒人们珍惜现实世界的美好，鼓励探索户外活动的乐趣。

GPT4 连环画故事书 2024-05-23

大模型应用的10种架构模式

本文总结了大模型应用领域的架构模式，包括路由分发、大模型代理、多任务微调、面向微调的分层缓存策略、混合规则、知识图谱、智能体蜂巢、智能体组合、记忆认知及双重安全等十个模式。这些模式旨在解决大模型应用中的成本、性能、准确性以及安全性等问题，使人工智能服务更加高效、准确且安全。文章强调，随着技术的不断探索和创新，未来可能还会出现更多新的架构模式，为人工智能服务的发展提供更多可能性。

大模型架构 2024-05-23

SD入门教程五：后期处理图片高清放大

本文介绍了如何利用放大算法显著提高图片分辨率，同时保持甚至增强图像的细节和清晰度。文章详细解析了后期处理模块中的图片输入、缩放、图片生成和进阶调参等四大区域的功能和使用方法。特别强调了ESRGAN系列算法和4X-UltraSharp算法在图像放大中的常用性和推荐性，同时简要解释了其他不常用算法的特点。文章最后总结了放大算法的应用场景，并预告了下一章将介绍ControNet，使图片更听从用户的意愿。

SD 入门教程修复 2024-05-23

24年首篇离奇论文：加点噪声，RAG效果翻倍？

本文研究了基于检索增强的语言模型（RAG）中信息检索组件对系统性能的影响，发现添加不相关文档可提高准确性，揭示了RAG系统的优化方向和局限性。论文首次关注RAG的IR方面，提出了方法策略并利用实验结果进行验证，为未来发展新一代信息检索技术提供了基础。未来可进一步研究内在机制，探索更复杂的模型和技术以提高性能。

RAG 检索增强 2024-05-23

使用大模型自动回复小红书/抖音/快手评论：通过RAG 优化LLMs实现

本文介绍了使用检索增强生成（RAG）技术改进大型语言模型（LLM）性能的方法，特别是在YouTube自动评论回复中的应用。文章首先解释了LLM的作用，即取代人工进行降本增效，并以自动回复用户提问为例说明其应用场景。然而，LLM存在两个关键限制：静态的知识和对小众及专业信息理解不足，这可能导致对用户查询产生不良或虚构的模型响应。为减轻这些限制，文章提出了RAG技术。RAG通过向基本LLM处理过程添加检索步骤，根据用户提示从外部知识库中提取相关信息并注入到提示中，从而增强LLM的性能。这种方法灵活且直接，可以改进基于LLM的系统。此外，由于知识存储在外部数据库中，更新系统知识也变得简单。文章详细描述了RAG系统的两个关键要素：检索器和知识库。检索器接受用户提示并从知识库中返回相关项目，通常使用文本嵌入来表示和比较用户查询与知识库中每个项目的相似度。知识库则包含想要提供给LLM的所有信息，可以通过从一组文档中构建得到。文章还讨论了构建RAG系统时的一些细微差别，如文档准备、选择合适的块大小以及改善搜索策略等。最后，文章提供了一个示例代码，展示了如何使用RAG技术改进YouTube评论回复程序，包括安装必要的Python库、建立知识库、设置检索器以及将RAG添加到LLM中。通过比较无上下文和有上下文的模型响应，文章展示了RAG技术如何帮助LLM更准确地回答技术问题，并捕捉更丰富的解释。这一方法不仅提高了LLM的性能，也使其更适用于实际应用场景。

RAG 大模型自动回复 2024-05-22

SD入门教程四：图生图基础用法

本文介绍了图生图的概念及其使用方法，即通过AI在参考图上做修改，实现图片的二次创作。文章详细解释了图生图的功能区域和参数设置，包括提示词区域、提示词推理区域、图生图主功能区域等，并提供了具体的操作示例。此外，文章还介绍了如何通过涂鸦、局部重绘等功能对图像进行精细化修改，并探讨了缩放模式、采样方法、迭代步数、重绘尺寸和幅度等参数对图像生成效果的影响。总体而言，本文旨在帮助读者更好地理解和掌握图生图的使用方法，实现更精确、更个性化的图像创作。

SD 入门图生图 2024-05-22

0基础！动手部署Qwen1.5-MoE模型！能力如何？API接入fastgpt等任何应用！喂饭到嘴教程，附模型下载！

本文介绍了moe模型的开发背景及优势，特别强调了新发布的Qwen1.5-MoE-A2.7B模型的能力超过7B，具有推理速度快、部署成本低的特点。文章还通过一系列问题测试了该模型的能力，并详细描述了如何在本地部署该模型，包括所需算力、环境配置、模型下载等步骤。最后，文章提到模型权重和推理仓库的下载方式，但仅限特定会员专享。

Qwen1.5-MoE 大模型下载 2024-05-22

【提前体验GPT-5】吴恩达AI智能体工作流详细解读

吴恩达教授提出AI智能体驱动的工作流方式将成为未来趋势，并证实通过此技术GPT3.5的效果可超越GPT4。他在斯坦福大学的演讲中详细解释了四种实现智能体工作流的设计模式：反思、使用工具、规划和多智能体协作。反思模式涉及让智能体检查并优化其工作；使用工具模式强调智能体依赖外部工具提升能力；规划模式要求智能体预先规划执行路径；多智能体协作模式则涉及智能体间的角色扮演和辩论以提升性能。这些模式将大幅扩展AI的功能。尽管智能体工作流需要时间来生成答案，但快速生成token的技术研究也在兴起。在使用智能体工作流时，需要保持耐心。

GPT-5 智能体 2024-05-22

老板：这龙谁做的？我：AI

2024龙年将至，文章分享了四组以龙为主题的关键词，涵盖不同风格与元素，如后启示录废墟、金绿配色、青色霓虹及女孩与白龙等，每组关键词均可生成独特效果图片，建议多次尝试以选到满意作品。

V6模式文生图关键词 2024-05-22

弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书

研究团队使用充满荒谬、离奇言论的中文社区“弱智吧”的数据训练AI模型，该模型在多项测试中表现卓越，甚至超过了使用其他平台数据训练的模型。研究团队认为，这种数据增强了AI的逻辑推理能力。此研究为中文大模型开发提供了有价值的指令微调数据集，展现了社交媒体数据在AI训练中的潜力。

弱智吧训练数据集 2024-05-22

开源！数字人资源大集合！

本文介绍了完整数字人项目及其资源合集，包含数字人相关的大量论文和源代码。文章列举了多个团队与人员的研究成果，以及相关的数据集，如SMPL、THUmanDataset和AGORA等。此外，还介绍了3D人体头像生成和动画以及穿衣人体运动生成等方面的研究进展，包括使用文本生成可动画的数字化身和具有高效3D铰接人体生成的技术。同时，文章还涉及了穿衣人数字化的研究，包括从单目图像恢复3D人体网格的方法以及具有镜像意识的神经人类等。最后，文章提及了智能手机视频中的逼真虚拟人技术，以及使用隐式表面对应和自监督学习进行3D人体网格配准的方法。

数字人开源 2024-05-21

微信为什么使用 SQLite 保存聊天记录？

本文介绍了SQLite作为一个被低估但功能强大的数据库，尽管没有网络层，但适用于多种场合。文章重点讨论了SQLite在2018年新增的SQL功能，包括布尔字面量和判断、窗口函数、Filter子句、Insert … on conflict (“Upsert”)、重命名列等。SQLite支持布尔值判断，窗口函数功能领先业界，Filter子句提供更易理解的聚合过滤方式，Upsert功能优雅处理主键和唯一约束冲突，并引入重命名列功能。此外，还提到了SQLite在API方面的一些变化。总之，SQLite在不断完善其SQL功能，成为一个可靠且广泛应用的数据库引擎。

SQLite 微信数据库 2024-05-21

<...16 17 18 192021 22 23 24 25 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1