文章列表-AI魔法学院

文章列表

华为盘古画画3.0发布 | PanGu-Draw：业界最大的中文文生图模型，效果YYDS！

图1显示了两种现有的训练策略:(a)级联训练，使用三个模型来逐步提高分辨率，数据效率高，但训练和推理时间增加了三倍。

PanGu-Draw 文生图

CodeGeeX2来了!效果超LLaMA2-70B

由于代码安全性，很难使用 Github Copilot 去 AI 生成，发现清华发布了「CodeGeeX2」，基于 ChatGLM2-6B 基座模型，CodeGeeX2-6B 进一步经过了 600B 代码数据预训练

CodeGeeX2 开源模型

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

2.77亿参数、1340万帧视频训练数据，背后蕴含着怎样的技术秘密？

Agent+GPT-4V 大模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15的推理速度，显著优于当前基于扩散的TTS模型。

F5-TTS 音频克隆

HalluQA: 测测中文大模型有没有一本正经胡说八道

第一类幻觉是模型会错误地模仿预训练语料中的行为或判断，而这些行为或判断是与真实世界不一致的。

大模型中文大模型幻觉

手把手带你微调一个自己的 ChatGLM2-6B 模型

ChatGLM2-6B 使用了 GLM 的混合目标函数，经过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果显示，相比于初代模型，ChatGLM2-6B 在 MMLU（+23%）、

ChatGLM2-6B

马斯克怒告OpenAI案解密：Ilya看到了什么？125万亿参数Q*细节曝光，53页PDF全网疯转

Ilya做出的突破，使OpenAI不再受限于获取足够的高质量数据来训练新模型，而这，正是开发下一代模型的主要障碍。

OpenAI 大模型

大模型微调方法总结

但是随着预训练语言模型越来越大，这个范式存在以下问题： ● 当我们 finetune 大模型时，由于训练成本太高，不太可能重新训练所有模型参数 ● 以前的方法（论文发表于 2021 年）都或多或少有其它性能问题

开源模型

开源大语言模型完整列表

基于预训练 + 持续微调的学习策略融合大规模普通文本和多种对话数据训练而成，充分利用训练语言模型语言能力和知识，高效构建强大的对话模型。

开源模型大语言模型

【重磅推荐】PaddleOCR：超越人眼识别率的AI文字识别神器！

6.训练定制：PaddleOCR支持用户根据自己的需求进行模型训练和定制，满足特定场景下的OCR需求。

PaddleOCR 文字识别

垂直领域大模型的一些思考及开源模型汇总

训练方法：基于Llama-7B模型，采用Lora方法进行模型训练。

垂直领域大模型开源模型汇总

从零开始学习大模型-第一章-大模型简介

数据需求高：为了有效训练这些模型，需要大量的训练数据。

大模型从零开始

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

训练数据以英文为主，不包含中韩日文，所有训练数据都是开源的，分词之后大约有1400B的tokens。

大模型

BGE M3-Embedding：智源最新发布的text embedding模型，多语言检索效果超过微软跟openai

2 BGE M3-Embedding 2.1 训练数据构建 M3-Embedding的训练用了非常庞大且多样化的多语言数据集，

BGE M3-Embedding 多语音检索

2万字大模型调研：横向对比文心一言、百川、Minimax、通义千问、讯飞星火、ChatGPT

、训练卡顿、无训练日志略 2023-9-27

大模型调研

<...13 14 15 161718 19 20 21 22 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1