文章列表-AI魔法学院

文章列表

Agent : 一文读懂LLM Agent架构，详解Profile，Memory，Planning，Action模块作用

除了这些基础知识，我认为最有价值的部分在于，它总结了基于大型语言模型（LLM）的Agent的架构，使我们能够按照一定的标准范式去设计自己的Agent。

大模型 LLM Agent

几款开源的OCR识别项目，收藏备用

tesseract Tesseract，一款由HP实验室开发由Google维护的开源OCR引擎，开源，免费，支持多语言，多平台; https://github.com/tesseract-ocr

OCR

AI Agents大爆发：软件2.0雏形初现，OpenAI的下一步

将 PDDL 计划翻译回自然语言。

agent

懒人福音！用AI生成会议纪要，让你的工作更高效！

**多语言支持**：一些AI系统能够支持多种语言，这对于跨国公司或有多语言需求的会议来说非常有用。

会议纪要 AI工具

智谱AI静悄悄的上线了一大波新模型，过年了，真的

我挨个列一下：大语言模型GLM-4-Plus。

智谱AI 大模型

17K star！30秒偷走你的声音，开源声音克隆工具

然后，它可以生成听起来自然的语音，以多种语言模仿该语音，同时为用户提供对情感、口音、节奏和语调等参数的精细控制。

OpenVoice 声音克隆开源

ChatGPT：12个写作提示词帮你覆盖所有主流写作场景

输出语言：{输出语言}。

写作创作提示词

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

一些有用的Notebook 与大型语言模型相关的笔记本和文章列表工具： 1.

LLM 大模型 GitHub

微软最新模型Phi-3 Mini开源登场！小模型，大未来！

Phi-3 Mini AI模型，在包括语言理解、逻辑推理、编程和数学在内的一系列基准测试中表现卓越，超越了大量参数高达数百亿的竞争模型。

Phi-3 Mini 开源模型微软

投资人逃离大模型

通义千问具备强大的语言理解、生成和推理能力，支持多语言对话和图片文本识别，广泛应用于智能搜索引擎、问答系统和智能对话系统等领域，参数规模从18亿到720亿不等。

大模型

RLHF 在 Text2SQL 领域中的探索

01 定义 Text-to-SQL（简写为Text2SQL），顾名思义就是把文本转化为 SQL 语言，更学术一点的定义是：把数据库领域下的自然语言（Natural Language

Text2SQL RLHF

13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

通过优化的声学模型和语言模型，确保语音的自然度和准确性，使其在多种场景下都能提供高质量的语音输出。

Fish Speech 本地搭建

微软对 Sora 进行了逆向工程分析，揭秘 Sora 的秘密

对研究界而言，我们建议寻找成本效益高的视频压缩和表现形式的替代方案。

Sora 微软

和大模型相关的一些术语（持续更新中）

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

大模型人工智能

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

它采用纯语言建模方式，打破了传统 TTS 模型依赖复杂架构和外部适配器的模式，为语音合成领域带来了新的思路。

OuteTTS-0.1-350M 音频

<...21 22 23 242526 27 28 29 30 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1