和大模型相关的一些术语(持续更新中)
AI魔法学院
2023-06-14
分享海报

1.什么是AI
AI,人工智能(Artificial Intelligence)的英文缩写。
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
工厂里的自动生产线,小米公司的“铁蛋”机器狗,火车站的人脸识别通道,科大讯飞的语音输入法,都是属于AI系统的应用。

2、什么是AIGC
AIGC,全名“AI Generated Content”,中文直译就是“人工智能生成内容”,也可以称为“生成式AI” (Generative AI)。例如AI文本续写,文字转图像的AI图、AI数字化主持人等,都属于AIGC的范畴。

3、什么是大模型
首先解释,什么是GPT。GPT的全称,是Generative Pre-Trained Transformer(生成式预训练转换器)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。GPT是AIGC的一个种类。
大模型一般指1亿以上参数的模型,但是这个标准一直在升级,目前万亿参数以上的模型也有了。大语言模型(Large Language Model,LLM)是针对语言的大模型。

4. 175B、60B、540B等:这些一般指参数的个数,B是Billion/十亿的意思,175B是1750亿参数,这是ChatGPT大约的参数规模。

5. 强化学习:(Reinforcement Learning)一种机器学习的方法,通过从外部获得激励来校正学习方向从而获得一种自适应的学习能力。

6. 基于人工反馈的强化学习(RLHF):(Reinforcement Learning from Human Feedback)构建人类反馈数据集,训练一个激励模型,模仿人类偏好对结果打分,这是GPT-3后时代大语言模型越来越像人类对话核心技术。

7. 涌现:(Emergence)或称创发、突现、呈展、演生,是一种现象。许多小实体相互作用后产生了大实体,而这个大实体展现了组成它的小实体所不具有的特性。研究发现,模型规模达到一定阈值以上后,会在多步算术、大学考试、单词释义等场景的准确性显著提升,称为涌现。

8. 泛化:(Generalization)模型泛化是指一些模型可以应用(泛化)到其他场景,通常为采用迁移学习、微调等手段实现泛化。

9. 微调:(FineTuning)针对大量数据训练出来的预训练模型,后期采用业务相关数据进一步训练原先模型的相关部分,得到准确度更高的模型,或者更好的泛化。

10. 指令微调:(Instruction FineTuning),针对已经存在的预训练模型,给出额外的指令或者标注数据集来提升模型的性能。

11. 思维链:(Chain-of-Thought,CoT)。通过让大语言模型(LLM)将一个问题拆解为多个步骤,一步一步分析,逐步得出正确答案。需指出,针对复杂问题,LLM直接给出错误答案的概率比较高。思维链可以看成是一种指令微调。

© THE END

转载请联系本网站获得授权

投稿或版权问题请加微信:skillupvip