浅谈提示词设计与坐标思维
公众微信号《商坛论衡》
随着大模型应用场景的普及,提示词的拟写得到人们重视。好的提示词可以更好地发挥AI的潜能;而不好的提示词,则会让AI变得平庸甚至出错。所谓提示词其实就是互联网搜索引擎中所使用关键词的组合;如果说文本生成效果的差异在于使用的提示词不同,不如说取决于提示词设计的组合结构的优劣。而提示词设计则取决于我们坐标思维的清晰与完善程度,如果说前者是后者的结果,那么它同时是人机互动的重要中介。
提示词的结构化要求凸显
互联网初起所使用的搜索工具,是由关键词引导出结果,提供给我们的是资料线索;而新兴大模型能够直接将相关线索资料组织起来,形成可长可短的文本,的确便捷多多。对于使用者来说,面对的其实就是多维化的搜索引擎;只不过自己所提供的指令从简单到复杂起来。从关键词到提示词,对于机器来说都属于指令。提示词的结构化被视为高质量的问题或者指令集,高质量的问题其实是指令集的结构化。
指令集的结构化不是机械的,与社会人为交流有关。这是为了在人机交互中明确彼此的定位,对于使用人而言,需要交待背景,让AI知道给谁说,以什么方式什么语言说等等;否则AI工具给出的文本可能会“对牛弹琴”。有一款AI工具的开发者告诉我们,理想指令链 = 任务 + 背景 + 范例 + 角色 + 格式 + 语气。从这里我们可以看出,指令集由指令链构成。指令链也可以叫做关键词链。当然,每一个关键词都可以用一句完整的语言表达出来。比如:请扮演一位历史学家,讲述古罗马帝国的崛起和衰落。无论这句话以哪一国语言、语法表达,智能模型都归之于“角色”这个关键词,继而明确“历史学家”的定位。这其实反映的是关键词思维,而每一个关键词又是一个变相或者自由度。
指令集中的每一个关键词都不是孤立存在的,往往有方向性要求;否则就会产生所谓的“语义熵”。这是因为一个关键词拥有多种含义,例如,英语单词“desert”可以指沙漠,也可以表示抛弃某人。当智能工具使用这类词语时,可能会对表达的含义感到困惑,即出现“幻觉”。在中文里,我们在夏天里说“能穿多少穿多少”,和在寒冷的冬天说这样的话,传达的是截然相反的意思。究竟应该多穿还是少穿,除了要明确季节背景,还要明确其指向。现代语言学奠基人诺姆·乔姆斯基认为,普遍存在的歧义暗示着语言主要用于思考,而非交流,因为有歧义的信号显然会阻碍交流。在人机交互中避免歧义就是要明确关键词的方向,在指令集中的若干关键词或者指令的指向之间,当然需要谐同,不能错乱。
指令链或者关键词链是有层次的,每一个关键词都可以展开为一个新的指令链,以此可以类推下去。反过来说,每一个指令链都可以归结于上一层次的关键词,成为上一层次指令链的组成部分。在上面所列举的理想指令链中,每个环节或关键词都可以展开为一个新的指令链。比如在“格式”部分,本身就需要提出具体的要求,比如生成一个带有标题和子标题的市场分析报告,包括图表和数据,或者说要包括标题、子标题、图表和数据等等。当然,在不同的层次中,在下一层次的一个关键词,应当受到上一层次指令链中每一个关键词的影响。比如角色部分,在上述理想指令链中中,“角色”是要求AI扮演一位历史学家讲述古罗马帝国的崛起和衰落,那么在“格式”的每一个子标题中,都应当扮演好该角色。
在坐标思维中完善指令集
指令集的组织性无疑是由AI使用者提出的,反映的是使用者的思维产物。既然文本生成效果取决于提示词设计的组合结构的优劣,那么使用者就需要适应这种要求,使自己的思维活动方式与之配套。像不能以己昏昏使人昭昭那样,不能以“人”昏昏使“机”昭昭。既然关键词链构成的指令集是人机交互的媒介,那么我们可以将人与之配套的思维方式叫做坐标思维或者关键词链思维,用以清晰表达AI任务的应有走向。
指令集其实有一个核心指令或者叫核心关键词,其它关键词都是围绕它展开,或者由它生发开来的。这就是上述理想指令链中所说的“任务”这个环节,指定任务是这个指令链的核心,它如同一颗指南针,引导AI朝着特定目标前进。比如要求AI回答以下问题: 什么是气候变化,为什么它重要,以及有哪些应对气候变化的方法,为AI提出了明确的任务。这三个问题中的核心关键词是“气候变化”,三个问题是对核心关键词的展开,也可以叫做分解。对AI提出的任务指令集,无疑是出于自己思考的框架,我们把它叫做思维坐标;对AI来说则是一种布局。只不过人不能满足于这种布局,要得出自己的结论,产生创新的思维火花,而不仅仅是从大模型中提取现有知识。
思维坐标是由思路构成的,不同的思路围绕着核心关键词而展开。比如围绕着“气候变化”可以展开为两种思路:对气候变化重要性的认知,以及应对气候变化的方法。在人际之间的交流中,我们把别人能够将问题解释的通叫做能说会道。一般认为,“道”就是说、讲,被用来形容口齿伶俐,很会说话,“能说”与“会道”是一回事。其实,两者是同一问题的两个方面,应该是“会道”而“能说”。应该将“道”理解成规律,而“会”是对规律的领会。因“会道”而能说,不仅容易让人接受,还能让人心情愉悦,让人信服。如果说人际交流,知道就是知路,就是有思路;那么在在人机交互中,AI的运行则是反向的,应当是“会道”之后才“能说”,即提供高质量的文本。
汉语言中的“路”一般用“条”来计量,而在思维坐标中,思路则用“维”称;一条思路也就是一维的思维坐标。这就是说思维坐标由思路构成,可以是多维的,通常为两维。在一般的两维思维坐标中,一条为纵坐标或者叫纵向思路,一条为横坐标或者横向思路。思路或者坐标的纵、横之别是相对的,反映了两类联系。相对而言,纵坐标上的关键词之间,存在着递进关系,彼此的位序不能颠倒错乱;横坐标上的关键词之间则是并列着的。在上述“气候变化”的指令集中,对其重要性认知的演变更像是纵向思路,为纵坐标;应对气候变化方法的列举则为横向思路,为横坐标。而每一条思路都可以生发出自己的关键词链,形成一个指令链,可以叫做分指令链,由此反映出思维活动的展开和清晰度。
在人机交互中梯次促进
在对AI工具的使用中,如果说提示词设计需要技巧已经得到证明,那么这种技巧不能是外在的,取决于我们自己的思维水平的提升,学会坐标思维是一个重要选项。提示词完善或者指令集形成的过程,就是思路形成,特定思维坐标由混沌到清晰的过程。这或许是一个悖论:既然我的思路成熟了,还要大模型干什么?反过来说,想要得到大模型的有效帮助,又需要摆脱我思维坐标的模糊状态。这实际上是一个在人机交互中梯次促进的过程。
毫无疑问,对AI工具的使用不应当替代人的思考,而应当有助于提升我们的思维水平;对AI工具的使用固然可以减轻文秘事务、文牍负担,为我们思维活动在更广泛的领域展开而搜集素材;但前提是我们对相关知识的脉络有基本的了解。科学研究的实践告诉我们,“提出正确的问题往往等于解决了问题的大半”;那么在对AI工具的使用中,一组好的指令集则往往是我们想要结果的一半。因而与其说只有好问题才能引出一个好答案,不如说有一个明晰的坐标思维方案才能得到好的文本。这就需要我们掌握坐标思维之类的方式,加强类似的思维训练。这反过来也会在人际交往中促进我们形成自己创新思维的坐标,以便为人们所接受,在原有的知识体系中增加或者丰富特定的环节,乃至开拓新的认知维度。
当然,人的创新思维有自身的规律,应该比现有的人工智能的开发水平更高。如果说创新思维所面对的未知问题或者领域是一个黑箱,那么打开这个黑箱的重要标志,就是促使其中的概念体系从混沌变为清晰,从而构成一个白箱;只不过其中的“指令集”不再是仅仅为AI工具而是为我们自己的实践活动下达的。如果说现有的AI工具提供给我们的文本离不开大模型的支撑,那么这实际上是一个从有到有的过程,难以从无到有。而从无到有正是我们的创新思维所要实现的跨越,从而为大模型提供新的“有”。如果说这是一种思维变革,那就会对社会生活产生重要影响。比如在教育领域,就不能再仅仅纠结于知识储备的“应试”,需要更多地进行创新能力的养成,从而为科技强国提供更多的人才。
对于人工智能的进一步开发也应当是一样,能够进行坐标思维或许可以成为新一代人工智能的目标。AI工具如果能够通过“涌现”自动生成“创意”,从而自动建立关键词链,自主确定思维坐标,那么它为我们提供的成果就可以从“文字”升级为“文创”,从“文稿”升华为“文章”。目前我们所看到的AI工具所提供的文本无论怎样丰富、专业,我们总会感到缺少“文章”的灵气。比如AI回应什么是气候变化,为什么它重要,以及有哪些应对气候变化的方法之类的指令链时,尽管可以十分周全,但仍然是一堆材料的累积,很难看到中肯的见解。实际上,如果我们提出类似的问题不是为了应付差事,那一定是在面对气候变化某种特定困惑,AI工具如果针对与此形成创见,那要比泛泛而论有意义的多。
谢谢关注公众微信号《商坛论衡》