不是模型不够强大，是你的提示不够精准。

当大型语言模型如ChatGPT在各领域大放异彩时，普通用户却对其指令设计一头雾水。这篇论文揭秘了与模型交流的秘诀，仅凭优化提示，就让GPT-4响应质量和准确性分别飙升57.7%和36.4%！图片例子说明了一个道理：提问的方式对AI的回答有着巨大的影响。不同的问法会引导AI生成不同风格、不同详细程度的答案。所以，想要从AI那里得到满意的答案，关键是要学会怎么提问。

这些提示词原则究竟有何魔力？又能否引领LLM走向全新高度？

LLMs的神秘面纱

在这里插入图片描述

LLMs，即大型语言模型，在自然语言处理的舞台上大放异彩。从Google的BERT到GPT系列，它们一步步颠覆了我们对机器理解语言的认知。

BERT的双向训练方式让机器像人一样理解上下文，T5则将各种NLP任务统一，让机器学习更加高效。而GPT-1，作为先驱者，用Transformer架构和无监督学习打开了新世界的大门。

GPT-2的进步更是惊人，15亿参数让它在文本生成上游刃有余。GPT-3的1750亿参数则让它在各种语言任务中都表现出色，不只是规模大，更是能力强。

其他LLMs也不甘示弱。Gopher模型以2800亿参数领先，不仅提升了语言处理能力，还让我们思考伦理边界。而Meta的LLaMA系列和Chinchilla则告诉我们，小模型也能有大作为，效率同样重要。

Mistral模型在效率与性能之间找到了平衡，成为新的佼佼者。而GPT-4和Google的Gemini家族更是将LLMs推向了新的高度，它们的理解和生成能力让人叹为观止。

与此同时，我们与LLMs的交互方式也在变革。提示词技术让我们只需简单提示，无需复杂调整，就能让模型产生惊人的效果。

提示词设计变得至关重要，它能引导模型产生截然不同的响应。

那么，如何设计有效的提示呢？

26个优化提示原则的揭秘

26条规则可以划分为以下五大类

提示结构与清晰度

涉及确保提示的目的、包含的信息和期望的输出格式明确清晰。

· 原则1: 清晰定义任务目标

· 原则2: 包含所有必要信息

· 原则3: 明确期望的输出格式

· 原则20: 鼓励视觉艺术创作的描述性提示

示例

· 原则1示例: “请总结以下文章的主要观点。”

· 原则2示例: “考虑到用户的初级知识水平，解释什么是量子计算。”

· 原则3示例: “列出三种最受欢迎的加密货币及其主要特点，格式为：名称 - 特点。”

· 原则20示例: “描述一个场景，其中一个孩子第一次看到北极光。”

具体性与信息

强调使用具体语言、提供足够背景信息和明确问题范围以提升效率和准确性。

· 原则4: 使用具体而非模糊的语言

· 原则5: 提供背景信息

· 原则6: 明确限定问题范围

· 原则21: 说明如何解释数据集

· 原则22: 提供统计分析的步骤

· 原则24: 设计互动式学习活动

示例

· 原则4示例: “在2023年，哪种编程语言最受欢迎？”而非“哪种编程语言很受欢迎？”

· 原则5示例: “考虑当前的市场趋势，分析比特币的未来价值。”

· 原则6示例: “只考虑欧洲市场，哪款电动汽车品牌最受消费者欢迎？”

· 原则21示例: “解释这个数据集显示的趋势。”

· 原则22示例: “列出进行线性回归分析的基本步骤。”

· 原则24示例: “设计一个游戏，帮助学习基础数学。”

用户交互与参与

包含设计交互式对话、使用积极反馈和可扩展对话流程以增强用户参与度。

· 原则7: 鼓励交互式对话

· 原则8: 使用积极的反馈来引导用户

· 原则9: 设计可扩展的对话流程

示例

· 原则7示例: “你还有其他关于量子计算的问题吗？”

· 原则8示例: “你的问题很好，更深入的了解可以帮助解决问题。”

· 原则9示例: “如果你想了解更多关于AI的伦理问题，我可以提供更多信息。”

内容与语言风格

关注适应目标受众的语言风格、使用清晰简洁语言和适当处理专业术语。

· 原则10: 适应目标受众的语言风格

· 原则11: 使用清晰和简洁的语言

· 原则12: 避免使用专业术语，除非必要

· 原则18: 引导生成具体的创意内容

· 原则19: 使用创意写作提示来激发新想法

· 原则23: 解释图表和数据可视化的含义

示例

· 原则10示例: 对于儿童，“什么是太阳系？”使用简单语言回答。

· 原则11示例: “在互联网上，个人隐私是如何受到威胁的？”以简洁明了的方式解释。

· 原则12示例: “解释什么是机器学习”时避免过度技术化的语言。

· 原则23示例: “这个柱状图展示的主要差异是什么？”

复杂任务与编码提示

涵盖分解复杂任务、使用示例阐述概念和逐步引导完成任务的策略。

· 原则13: 分解复杂任务

· 原则14: 使用示例来阐述复杂概念

· 原则15: 逐步引导用户完成任务

· 原则16: 提供代码示例

· 原则17: 鼓励使用伪代码来澄清逻辑

· 原则25: 提供分步学习资源

· 原则26: 使用问题和答案格式来复习知识点

示例

· 原则13示例: 对于编写一个程序，先询问用户需求，然后逐步构建程序结构。

· 原则14示例: 使用具体示例来解释复杂的编程概念，比如循环。

· 原则15示例: 在创建一个网页时，先询问布局，再讨论内容，最后讨论设计元素。

· 原则16示例: “给出一个Python函数示例，用于计算两个数字的和。”

· 原则17示例: “用伪代码描述如何遍历列表中的每个元素。”

· 原则25示例: “分步骤教授如何写一个简单的计算机程序。”

· 原则26示例: “什么是光合作用？请简短回答。”

实验验证与应用前景

小型、中型、还是那些大家伙模型，它们都在这套原则下焕发新生。特别是当原则2、5、15、16、25和26遇上大型模型时，火花四溅，提升尤为明显。哦对了，别忘了原则14，它可是通吃所有问题哦！

谈到正确性，这些模型在平均性能上可是达到了20%～40%的准确率。小模型和中模型轻松应对10%～40%的准确率范围，而大模型更是突破了40%的大关，让人眼前一亮。

不仅如此，在个体模型上，仅仅是修改了提示语，响应质量就稳稳地提升了50%。这可不是偶然，不同的大型语言模型都呈现出了这一喜人趋势。我们详细记录了每个原则在不同模型上的表现，成果斐然。

而且，你发现了吗？模型越大，正确性的提升就越明显。从LLaMA-2-13B到GPT-4，这一趋势一目了然，再次证明了我们的原则在提升模型性能上的实力。

看到这里，你是不是对我们的原则充满了期待？

论文：https://arxiv.org/pdf/2312.16171.pdf

结语

优化提示原则就像是给LLMs装上了翅膀，让它们在AI的天空中飞得更高、更远。

出自：https://mp.weixin.qq.com/s/mnn4MFf0iUv4jQp4UTA8zg