假期抽出了一些时间,整理了之前阅读AI论文时做的一些笔记。其中,《Progressive-Hint Prompting
Improves Reasoning in Large Language Models》这篇论文对于目前集中研究的写作AI颇具价值。今天,我将重点分享一下读后心得,介绍从中提炼出的提示词编写技巧。
https://arxiv.org/pdf/2304.09797.pdf
论文中介绍的Progressive-Hint Prompting(PHP)方法是一种创新的提示技术,其核心目标是通过逐步引导,利用之前生成的答案作为新的提示,以获得更为精确的答案。这一方法仿照了人类的思维模式,即用已有的答案作为线索,重新审视问题,进而得出更加准确的结论。PHP方法让模型能够自动进行多轮交互,从而提升模型的推理能力和生成的质量。
如果觉得这段描述很抽象,我举一些例子说明一下。假设我们要解决一个复杂的数学问题。我们可以使用PHP方法,通过以下步骤逐步引导模型得到正确答案:
第一步: 提出基础问题:“解释一下什么是二次方程。”
模型生成答案:“二次方程是一种形式为ax^2 + bx + c = 0的代数方程,其中a、b和c是常数,a≠0。”
第二步: 使用先前的答案作为提示,提出更具体的问题:“你刚刚提到了二次方程的一般形式。现在,请解释一下如何求解二次方程。”
模型生成答案:“二次方程可以通过公式x = [ -b ± sqrt(b^2 - 4ac) ] / 2a来求解,这被称为二次公式。”
第三步: 继续使用先前的答案作为提示,提出更深入的问题:“你解释了如何使用二次公式求解二次方程。现在,请给出一个具体的二次方程的例子,并求解它。”
模型生成答案:“好的,考虑二次方程2x^2 - 8x + 6 = 0。我们可以使用二次公式来求解它。将a=2,b=-8,c=6代入公式,我们可以找到x的值。”
这个例子已经能很好的概括论文的核心思想了,当然这个例子也是ChatGPT学会了PHP提示词技巧后自动生成的。
下面我将这个PHP的提示词方法,应用到更复杂的AI写作任务中。以下是使用PHP的方法与ChatGPT的交互过程:
第一轮交互:
用户:
请简要描述什么是嘲讽,并给出一个简单的例子。
ChatGPT:
嘲讽是一种表达方式,通常是出于轻蔑、讥笑或不尊重的目的,用言语或行为使他人感到难过或不舒服。嘲讽可能是明显的,也可能是微妙的,通常包含戏弄、讽刺或挖苦的成分。
例如,如果一个人不小心跌倒了,旁边的人可能会说:“哇,你真是个舞蹈高手!”这句话表面上是在赞扬,但实际上是在讥笑对方跌倒的样子,这就是一种嘲讽。
第二轮交互:
用户:
你刚刚解释了嘲讽的概念。现在,请为一篇嘲讽小说构思一个主题和背景。
小说灵感来源:美国参议院决定放宽非正式着装规定。多位参议员对此进行了激烈的讨论,争论在正式场合是否应容许穿着休闲服装。正当美国即将面临政府关闭的时刻,这些议员却在忙于讨论着装问题。
ChatGPT:
小说主题:
该嘲讽小说将突出政治人物常常沉迷于表面琐事而忽略了更为重要、紧迫的国家问题的荒谬性。主题会集中于个人虚荣和表面形式与国家利益和社会责任之间的冲突和矛盾。
背景:
美国处于政府即将关闭的紧要关头,而一群参议员却在参议院内争论着是否应该放宽非正式着装规定。这场看似微不足道的争论暴露了这些政治人物的无能和虚荣,与此同时,国家的重大问题和真正需要解决的危机却被置于一旁。
故事大纲:
1.开场:
描述国家正面临政府关闭的严重危机,而参议员们却在会议室争论着装规定。
2.人物设定:
引入几位具有代表性的参议员,他们代表了不同的政治观点和价值观。一些极端保守,坚持传统和正式的着装;另一些试图推动变革,主张更为休闲、自由的着装。
3.冲突升级:
描述这场争论如何越演越烈,参议员们各自发表演讲,激烈地辩论,甚至可能发生小规模的冲突。
4.社会反应:
描写民众、媒体和其他政府部门对这场争论的反应,显示人们对政府无能和轻率的失望和愤怒。
5.高潮:
当国家危机进一步加剧时,争论达到高潮,最终参议员们可能会意识到他们的错误,开始着手解决更为重要的问题,或者继续沉溺于这场毫无意义的争论,导致更严重的后果。
结局:
结局可以是开放式的,留给读者思考,也可以明确描述结果,强调嘲讽的主题。
标题建议:
《华盛顿的时尚大战》
此小说通过夸大和讽刺的手法,揭示了政治人物往往忽视实质性问题,沉溺于表面和无关紧要的争论,从而引发读者对现实政治和社会现象的深入反思。
第三轮交互:
用户:
你已经构思了主题和背景。现在,请更详细地描述这些情节和人物,包括他们的性格、动机和冲突。
ChatGPT:
更详细的情节描述:
1.开幕戏:
在政府关闭的前夕,参议院陷入了一场由约翰·史密斯引发的关于着装规定的争论。这场争论迅速升温,变成了一场全国性的讨论和争议。会议室里的氛围变得越来越紧张,而外界的民众也开始大声疾呼,表达他们对政府行动的不满和愤怒。
2.冲突升级:
争论变得激烈,每个人都试图大声说话以压倒对方。这场毫无意义的争论占据了所有人的注意力和时间,导致真正重要的议题被忽视。
3.危机到来:
随着政府关闭的日子越来越近,国家陷入了混乱和不安。民众开始恐慌,但参议院却仍然在争论着装规定。
4.觉醒与反思:
在这样的紧要关头,迈克尔·杨勇敢地站出来,他以理性和激情的演讲指出了参议员们的错误和无知,并提醒他们应该马上行动,解决迫在眉睫的危机。
5.解决与后果:
参议员们最终回到正轨,找到了避免政府关闭的办法。但是,他们在这场无意义的争论中浪费的时间和资源无疑给国家和民众带来了长久而深远的影响。
人物详细描述:
1.约翰·史密斯:
1.
性格:刚愎自用、固执己见、传统。
动机:他认为维护传统就是维护参议院的尊严和权威,严格的着装规定是这个尊严的一部分。
冲突:他与提倡变革的参议员和愤怒的民众产生冲突,固守他的信念,拒绝妥协。
2.琳达·约翰逊:
性格:开明、自由、有说服力。
动机:她认为放宽着装规定会使参议院更人性化、更接近人民,从而推动更多的积极变革。
冲突:她与保守的参议员和支持传统的人发生冲突,努力推动变革,使参议院更加开放和多样化。
3.迈克尔·杨:
性格:理想主义、勇敢、富有同情心。
动机:他希望使政府回到正轨,解决真正的问题,服务于民众。
冲突:他与无视国家危机、只关心着装问题的参议员产生冲突,努力唤醒他们的良知和责任心。
4.莎拉·米勒:
性格:尖锐、无畏、批判性强。
动机:她希望通过她的报道揭露政府的无能和错误,推动社会改变。
冲突:她与试图掩盖事实的政府官员发生冲突,努力寻求真相并传递给大众。
5.汤姆·贝克:
性格:朴实、直率、有责任感。
动机:他代表了普通民众的愿望,希望政府能够解决实际问题,提供稳定和安全。
冲突:他与忽视民众需求、专注于自身争论的政府官员发生冲突,试图让政府听到民众的声音。
这些人物和情节一同勾画了一幅政府内部和社会大众的生动画面,深刻反映了政治决策背后的人性、价值和冲突。
第四轮交互:
用户:
请你以王朔的文风,参考以上详细的情节描述,开始编写“开幕戏”章节,字数要求2000个拉丁字符。
ChatGPT:
王朔的文风通常以幽默、尖刻、直接和俚俗著称,下面试着以他的风格开始写这个“开幕戏”章节:
在国家的大门快要关上的时候,参议员们却闹得不可开交。啊,不,别误会,他们可不是为了什么迫在眉睫的国家大事,而是为了他们能不能穿运动鞋和短裤来开会这种小事。约翰·史密斯老头子一脸严肃地坐在那,仿佛这衣服问题比国家存亡还重要。他那一套尊严、礼仪、传统的大道理喋喋不休,仿佛穿上正装就能解决所有问题似的。
“这可是国家的尊严!我们不能让人看轻了我们的参议院!”约翰·史密斯咆哮着,脸红脖子粗的。
琳达·约翰逊则一脸不屑,她坐在那里,轻松自在地穿着她那件舒适的休闲服,看着约翰像个愤怒的小孩子一样嚷嚷。
“约翰,你这老顽固,你那套陈腐的观念真是让人笑掉大牙!”她轻蔑地说,眼睛都没从她的iPad上移开。
。。。
如果把上述PHP模式的提示词整理合并成一个提示词,直接生成的结果如下,生成内容细节上比PHP模式差了一些:
PHP提示词技巧在复杂任务的处理上,还是比较有效果的,这篇论文中还有很多有价值的信息,对此感兴趣的朋友们,可以查阅原文,深入学习。我的分享,主要是希望大家能从中学到更多提示词的应用技巧,深刻理解PHP提示词的底层逻辑,并将其灵活运用到实际工作中。
出自:https://mp.weixin.qq.com/s/9JRnmOPUMTdm4X9DiUkOYg