文章列表-AI魔法学院

文章列表

麦肯锡专家都在用的方法：用ChatGPT速览用户研究领域的 50 个核心概念

为此，你可能会与顾客交流，观察他们的用餐习惯，甚至邀请他们品尝新菜品并提供反馈。

用户工作

微软研究团队：Sora核心技术及未来机会研究报告-中英对照版

紧接着，流模型 [9] 和扩散模型 [10] 的发展，使图像生成的细节和质量得到了进一步提升。

sora 论文

AI Agent行业深度：框架拆解、应用方向、应用领域及相关公司深度梳理！

Embedding技术是一种将图像、音视频等非结构化数据转化为计算机能够识别的语言的方法，例如常见的地图就是对于现实地理的Embedding，现实的地理地形的信息其实远远超过三维，但是地图通过颜色和等高线等来最大化表现现实的地理信息

AI Agents 大模型

AI Agent行业深度：框架拆解、应用方向、应用领域及相关公司深度梳理

Embedding技术是一种将图像、音视频等非结构化数据转化为计算机能够识别的语言的方法，例如常见的地图就是对于现实地理的Embedding，现实的地理地形的信息其实远远超过三维，但是地图通过颜色和等高线等来最大化表现现实的地理信息

AI Agent 大模型人工智能

[论文] 阿里提出AgentScope：灵活强大的智能体框架

ensp; 多模态应用的广泛兼容性：随着大规模多模态模型的显著进展，AgentScope 支持多模态数据（例如文件、图像

AgentScope 语言大模型智能体

大模型能力快速测评极简题目

玉皇大帝住在平流层还是对流层？

大模型

Google 模型解读 | MoveNet-SinglePose：自底向上做单人姿态估计

对于四个头部预测的结果，会按照以下流程进行处理： Step 1 首先我们看到Center Heatmap，它的形状为[B, 1, H, W]，预测的是每个人的几何中心

MoveNet-SinglePose Google 模型

大模型应用中大部分人真正需要去关心的核心——Embedding

主流中文embedding模型现在主流的中文embedding模型其实也不是太多，以下就是主要的embedding模型了，目前我们用的m3e，但效果感觉还有待提升。

大模型

SD入门教程零：应用场景

Stable Diffusion自2022年开源发布以来，其应用场景已经迅速扩展到了多个领域，艺术家和设计师使用SD来生成创意图像，探索新的视觉风格，或者作为灵感来源。

Stable Diffusion 文生图入门教程

AI Agent新对决：LangGraph与AutoGen的技术角力

AutoGen是由微软开源的Multi-Agent框架，它可以使得电脑程序像人一样交流合作以完成任务。

LangGraph AutoGen 对决

清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench：GPT-4是全能战士，超越所有模型

Lilian Weng认为一个AI Agent系统应当包含如下图所示的几个部分：规划（Planning）、记忆（Memory）、工具使用（Tool Use）。

GPT-4

中文OCR超越GPT-4V，参数量仅2B，面壁小钢炮拿出了第二弹

传统大模型只能处理 448×448 像素固定的小图，对于包含海量信息的更精细图片识别则力有不逮。

MiniCPM 大模型

微软对 Sora 进行了逆向工程分析，揭秘 Sora 的秘密

紧接着，流模型 [9] 和扩散模型 [10] 的发展，使图像生成的细节和质量得到了进一步提升。

Sora 微软

检索增强生成(RAG)有什么好的优化方案

图1 RAG工作流程（with memory）从RAG的工作流程看，能优化的模块有：文档块切分、文本嵌入模型、提示工程优化、大模型迭代。

RAG 检索增强生成

数字人直播哪家强？百度、硅基、风平与闪剪四大AI数字人横向评测！

关于做直播真的需要如此高的CPU配置，我的观点是，在比较极端的直播场景中，比如用4K摄像头采集画面，直播中插入了大尺寸的视频素材、全程开人物美颜、开抠背景，那么就真的需要13700K、13900K这样的高端配置才能确保流畅

数字人数字分身

<...35 36 37 383940 41 42 43 44 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2024 AI魔法学院

京ICP备20027199号-1