本篇文章是前几篇文章的总结,一图胜千言,所以用如下的思维导图将吴恩达老师Prompt教程进行了梳理。
我们也在本篇文章对之前的几篇文章进行一个总结:
第一篇文章主要针对当前GPT最为常用的两种模型进行介绍。
当今最为热门的LLM实际上有两种模型类型,一种是基础模型BaseLLM,一种是微调模型Instruction tuned LLM。
其中Base LLM是根据训练语料选择最大可能性的单词进行填充,因此,会在填空类内容上表现不俗,但是面对QA类似的问题,可能并不能令人满意。
Instruction tuned LLM首先需要从大量文本数据中训练处一个Base LLM,随后使用指令和比较好的输入输出去进一步训练(微调、优化)LLM,在训练过程中,输入和输出都是作为指令给到LLM,要求Base LLM去遵循这些指令,然后,使用RLHF技术进一步微调,最终被训练为当前我们正在使用的ChatGPT.
BaseLLM一般用于文字的生成,微调模型则是ChatGPT的模型基础。
微调模型的基础就是BaseLLM,
第二篇文章和第三篇文章主要针对Prompt的书写规则进行了详细说明。
Prompt可以认为是GPT的编程语言,用于将用户的需求转化为GPT的运行指令,其书写规则需要满足两大原则:
1)指令必须清晰具体
合理使用分隔符,将特定文本和指令内容分隔,避免提示词冲突;
指定输出格式,方便后续的开发程序获取数据,比如JSON;或者方便在页面展示,比如HTML格式;
先进性输入先决条件的校验,类似于接口开发的参数合理性校验,减少后续异常情况的输出;
对于复杂的需求,需要给出一些样例数据,让GPT进行一定的参考;
prompt书写最重要的原则就是详细明确,其中涉及四个策略: 1)合理使用分隔符 2)确定输出格式要求,如JSON或者HTML 3)使用GPT对执行的必要条件进行校验,类似于开发过程中的参数校验 4)给出一定的示例让GPT按照用户的需求进行输出
2)给模型充足的时间或者详细的执行步骤,以保证输出质量
对于复杂任务,明确完成任务的详细步骤;
对于正误判定的场景,可以先让GPT按照给出的问题给出解题思路,然后与给出的思路进行比较,以合理判定;
让时间来更好的调教GPT 提到,想要调教好GPT,需要一定的时间。那么今天我们要说的是,想要调教好GPT,还需要耐心。
第四篇文章主要讲述了Prompt迭代的思路以及重要性。
Prompt的书写迭代过程,实际上和我们在开发过程中的代码调试过程非常类似,一步步调试,确认方案可行。在迭代过程中,就像我们写汇报PPT一样,尽可能保留历史版本,这样才能更好的沉淀自己的迭代思路和思想。
Prompt的书写迭代过程,实际上和我们在开发过程中的代码调试过程非常类似,一步步调试,确认方案可行。
在迭代过程中,就像我们写汇报PPT一样,尽可能保留历史版本,这样才能更好的沉淀自己的迭代思路和思想。
第五篇文章主要描述了GPT的主要使用场景之一,那就是归纳总结,可以让我们节省大量的精力和时间来完成大量的工作。
比如归纳总结、特定信息提取、信息总结等等,可以使用GPT快速实现能力的实现,可能每个能力只需要一句Prompt就可以实现。
GPT的归纳总结能力可以快速提升文章或者资料的阅读速度,甚至可以减少我们70%以上的无效时间
第六篇文章,我们主要继续介绍GPT的使用场景,比如说情感分类、文本信息提取、主题推断、文本匹配等等能力。
如果不使用GPT,那么就需要先搜集大量训练样本,选择算法模型,然后花费几周的时间训练多个模型才可以实现的能力,当前只需要GPT就可以完成。
GPT的引入大大降低了算法入门的难度,甚至是一个没有编程经验的小伙伴也可以快速的按照自己的想法搭建一个复杂的系统,通用算法的未来之路在哪里?
第七篇文章则是针对GPT最为擅长的文本修改能力进行说明,可以使用几行代码就完成通用翻译器的开发,甚至是格式修改以及语法校验,大大提高了一些小伙伴的论文书写的成功率。
GPT作为当前最为热门的技术方向,在提高我们的工作效率以及工作质量方面都有着非常重要的作用。 GPT不仅可以实现通用的翻译器能力,还可以完成拼写错误检查和语法纠正。
第八篇文章讲述的是利用GPT的扩写能力,给了我们每个人书写小说的可能性,GPT可以根据用户的几句话,甚至是主旨思想完成一篇小说的书写。
GPT的扩写能力能够让我们从“下笔无一言”,到“胸有成竹”,实现了人人都是小说家
第九篇文章则是很多人都想实现的能力,那就是聊天机器人,虽然之前也有很多的客服机器人,但是往往是答非所问,那么如何通过简短的几行代码实现一个属于自己的专属机器人呢?
当前GPT最为热门的开发方向就是聊天机器人了,如果通过几行简短的代码就实现聊天机器人,甚至是一个没有任何编程经验的人,如何实现机器人的研发呢?
出自:
https://mp.weixin.qq.com/s/KECEIHC4ZRQMbSzFd8l1Hw