首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· M3E 可能是最强大的开源中文嵌入模型
· 玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
· Prompt提示优化工具
· ChatLaw
· AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
· 一张照片秒生不同风格图像!小红书InstantID来了!
· 独家!黄太吉创始人再创业:首次披露惨败内幕
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· 比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
· 变天了,AI可以一键生成中文海报了......
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
开源大模型专栏
微调
微调大型语言模型-核心思想和方法介绍
在快速发展的人工智能领域,高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型,如果您刚开始,这可能会让人不知所措。本质上,我们可以通过两种主要方式将预训练的大型语言模型用于新任务:上下文学习(in-context learning)和微调(finetuning)。在本文中,我们将简要介绍in-context learning的含义,然后我们将介绍微调 LLM 的各种方法。
大模型
训练
2023-07-18
2023-07-18
人工智能
人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法
在快速发展的人工智能领域,高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型,如果您刚开始,这可能会让人不知所措。本质上,我们可以通过两种主要方式将预训练的大型语言模型用于新任务:上下文学习(in-context learning)和微调(finetuning)。在本文中,我们将介绍介绍微调 LLM 的各种方法。
大模型
微调
2023-07-18
2023-07-18
大模型
LLM大模型推理输出生成方式总结
大模型在输出结果时,会有多种方式和算法,本文列举其中几种算法,包括贪心算法、n贪心搜索/采样(greedy search/sampling)、集束搜索(beam search)、TopK采样等
大模型
2023-07-17
2023-07-17
LLM
谈谈LLM在推荐域的渗透,探索推荐新范式
搜索慢慢的被大模型渗透,那么很自然很多人想到了推荐,但是推荐是不是真的可以被大模型渗透呢?大模型能改变推荐的范式吗?
大模型
2023-07-17
2023-07-17
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知识库
最近,智谱 AI 研发团队又推出了 ChatGLM 系列的新模型 ChatGLM2-6B,是开源中英双语对话模型 ChatGLM-6B 的第二代版本,性能更强悍。本文就基于ChatGLM和Langchain搭建一个私域专属知识库
知识库
2023-07-16
2023-07-16
如何用大语言模型构建一个知识问答系统
传统搜索系统基于关键字匹配,在面向:游戏攻略、技术图谱、知识库等业务场景时,缺少对用户问题理解和答案二次处理能力。本文探索使用大语言模型(Large Language Model, LLM),通过其对自然语言理解和生成的能力,揣摩用户意图,并对原始知识点进行汇总、整合,生成更贴切的答案。关于基本思路,验证效果和扩展方向,可以参考正文的介绍。
知识库
2023-07-14
2023-07-14
ChatGLM
【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
主流的开源大语言模型主要有三个:LLaMA、ChatGLM和BLOOM。基于这三个开源模型,业界进行了指令微调或强化学习,衍生出了许多不同的大模型。下面从训练数据、tokenizer和模型结构上对这三个大语言模型进行比较。
大模型
微调
训练
2023-07-13
2023-07-13
大模型
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
训练
微调
2023-07-12
2023-07-12
大模型
真格基金大模型能力测试问题集---垂直能力篇
我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
中文
训练
大模型
2023-06-28
2023-06-28
大模型
真格基金大模型能力测试问题集---进阶篇
我们的出发点是尽量覆盖更多类型的 NLP 任务。我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
中文
评测
大模型
2023-06-28
2023-06-28
大模型
真格基金大模型能力测试问题集---基础篇
我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
大模型
训练
中文
2023-06-28
2023-06-28
Python
LangChain手册(Python版)11模块:提示模板
语言模型将文本作为输入——该文本通常被称为提示。通常这不是简单的硬编码字符串,而是模板、一些示例和用户输入的组合。LangChain 提供了几个类和函数来简化提示的构建和使用。
大模型
2023-06-16
2023-06-16
微调
一文讲明白什么是预训练、微调和上下文学习
最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。
大模型
训练
2023-06-14
2023-06-14
大模型
企业如何更好的使用大模型?都有哪些框架和方案
原文标题:几分钟开发 AI 应用成为可能,为什么说大模型中间件是 AI 必备软件?
人工智能
大模型
2023-06-13
2023-06-13
RAG
图片拖拽神器DragGAN介绍及官方安装文档说明
拖放图像编辑是一项功能强大的技术,它涉及训练生成模型来根据用户提供的指令转换图像。该技术的一个流行实现是拖放生成器(DragGAN),这是一个深度学习模型,当用户将图像拖放到基于web的界面中时,它可以将图像转换为另一个图像。
开源
2023-06-04
2023-06-04
<
1
2
3
4
5
6
>
1
2
4
5
6
7
8
9
100