与AIGC共舞

提升与AIGC沟通的能力

prompt 咒语

Alt text
自chatgpt、midjourney、stable difussion等文字和文生图模型发布以来,社会上出现了一类新的工种:prompt 工程师,与之对应的还有prompt工程。

prompt工程:Prompt也叫提示词,简单的理解成它是给大模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。大模型会基于 prompt 所提供的信息,生成对应的文本或者图片。Prompt工程即指针对于Prompt进行结构、内容等维度进行优化的AI技术,它把大模型的输入限定在了一个特定的范围之中,进而更好地控制模型的输出。 Prompt工程的作用,就是通过提供清晰和具体的指令,引导模型输出生成高相关、高准确且高质量的文本对答内容,属于自然语言处理领域突破的重要工程。因此,顾名思义prompt工程师就是做prompt工程的人。(内容来自baidu文心文档)

由于要生成高质量的文本和图片对prompt有一定的要求,网上因此出现了 prompt商店,专门销售一些不错的prompt,这些prompt能够帮助我们设计适合意图的prompt,从而获得高质量图片和文字输出。

Alt text

图:截图来自网站 promptbase

为什么会如此呢,这是因为,当前的AIGC需要人类提供比较明确的提示信息才能生成可靠、满足需求和意图的内容。

尽管网路上有一些观点认为,随着AIGC的不断演进,可能要不了多久,就不再需要prompt工程师了。但本文认为,无论prompt工程是否是短期现象,让AIGC在第一时间理解人类需求和意图始终是根本所在,而理解人类语言和理解人类意图是不同的层面,理解语言是理解意图的首要条件却不是充分条件。

比如,在中文文化下,“吃饭了吗”,只是一句招呼寒暄之语,而绝不是真的关心你是否吃饭了,也并不蕴含要请你吃饭的意思),请看chatgpt对于意图的理解,即便我设定了她的中国人角色,依然不能有效理解我的意图,经过不断的尝试,最后才有点气起色。而对我来说,也还没找到触发她快速进入中国人角色,显现中国文化的方法。(如果您尝试出来了,欢迎下方留言告诉我)不过,也许chatgpt还没有能够学到中国文化的精髓:)。

Alt text

这就需要使用AIGC的人具有高效表达意图和需求的能力,具有挖掘AIGC知识和智慧的能力。我们相信在未来AGI时代,即便有了很强大的AI agent,这些能力依然是保你领先一步的关键,正如现在已经有人在prompt market靠买prompt获益一样,正如当前各行业prompt工程师极其稀缺一样。

基于DIKWP框架的prompt咒语构建

网友们将prompt戏称为咒语,我们不难体会出,当前的prompt设计有点"玄学"的味道,这也就意味着当前还没有成熟的理论框架来指导人们设计有效标度意图的prompt。我们尝试利用DIKWP模型来指导prompt的设计,目前还是处于探索阶段,未来需要形式化,工具化。

DIKWP是什么

详细而丰富的解释可参考DIKW

DIKWP(data,informaton,knowledge,wisdom, purpose) 是信息处理中的一种金字塔结构框架。

  • Data。 data是原始的。比如我们可以从温度计上读出数字 40。我们在从温度计读出这个数字之后,可能会有不同的反应。这就涉及到下一步 data的含义的解读。
  • Information。 信息是为数据赋予含义后的存在。还是以上述温度计为例。假如我们给一个完全不懂温度计的小孩看这个数字,他不能有效解读40的含义。但是理解温度计的人是知道40在我们的日常生活中它表示的是40摄氏度的意思,这个40摄氏度就是信息。如果我们用手中的尺子,那么信息可能就是40cm;如果我们谈距离,那可能是40km。所以数据是40,信息是40度,40cm等等。
  • Knowledge。知识是我们头脑中积累的关于信息在某种情境下的事物的各种关系以及如何演化的存在。比如,温度计显示40度。那我们要看看这个温度计用在什么场景,如果是测量人体体温,那么你会相当的紧张,这是高烧中的高烧了,因为你知道人体和这个40度体温之间的关系是要命的关系,任其发展,是要出人命的。而如果,你是用温度计来测量饮用水,那么这时你可能会比较满意,刚刚好。
  • wisdom。 智慧。可以理解为基于知识我们可以做什么,如何来理性或趋利避害的行事。
  • purpose。目的。创获智慧(来自华东师范大学的理念:智慧的创获,品性的陶熔,民族和社会的责任)实现目标。比如,如果体温达到40度了,我们的目的是要尽快降温救治,这时候我们的wisdom是什么呢,是一些列的操作,物理降温方案,合理用药发方案,去医院急救的方案。

这是一个金字塔,从底层到顶层是D,I,K,W,P。

Alt text
source:DIKW金字塔

现在如果我们使用prompt和AIGC交流的时候,我们得从顶层到底层来看。首先明确P,即我们希望AIGC做什么;紧着会跳过wisdom,我们期待并假设AIGC拥有我们还不知道的某种widsom,从而能帮我们很好的解决问题,AIGC的这个wisdom可能依赖或者不依赖于我们给他的knowledge,因为鉴于她充分吸收了人类互联网上几乎全部的海量知识,她可能已经有了这样的knowledge,所以大多数情况下,我们也不用提供knowledge。剩下的就是information和data了。我们要明确的,详细的告知AIGC我们所拥有的信息。下面我们看一个例子。

案例1:信息不足,输出无价值

prompt
> 我想去旅游,请你告诉我要带什么衣物。

chatgpt

Alt text
在这个例子中,我们有purpose。但是仅此而已,因此chatgpt输出的内容比较模糊。我们改进一下。

案例2 补充信息,输出明显改善

prompt :

 我想去旅游,请你告诉我要带什么衣物。我可提供如下信息。
 信息:新疆
 信息:旅游季节,6-7月份
 信息:男性,成人

chatgpt:

Alt text

比较案例1和案例2

很明显,案例1在,因为我们没有提供足够的信息,导致chatgpt需要自己给出信息,比如她对不同季节和气候条件分别提出建议,且给出的都是一般性的知识,参考价值不大。在案例2中,我们提供了相对足够的信息,chatgpt也能给出有针对信得有价值的信息,依照这个模式,我们可以不断的补充信息条目,从而实现比较结构化,易遵循的prompt构建,以充分挖掘chatgpt的知识和wisdom。

在上面的案例中,我们没有提供knowledge,因为chatgpt学到了全网中的各种知识,她知道目的地、季节的对游客的影响。

总之,在我们设计prompt的时候,我们需要特别考虑足够信息下的目的设计,对于特殊情况,我们也需要补充必要的knowledge。比如,在之前的分享中,我们为chatgpt提供了如何根据词汇获取图片的知识,从而是的chatgpt也可以输出图片给我们。

收敛到最佳交互沟通方式

如上所述,prompt的质量对于AIGC 智能体高效准确理解人类意图,并提供高质量返回具有重要意义。然而,对于复杂问题,这样的prompt一般人很难设计好。因此,很多研究人员提供了各种各样的promt工程方法,我们也简单探讨了基于DIKWP的prompt设计方式。

我们相信,未来可能会出现面向不同行业的不同的prompt工程最佳实践,这种最佳实践中,AIGC和人类可能会有一个模式收敛点:

  • 一方面,我们不能指望AIGC在任何情况下,尤其是复杂任务情况下,快速(意味着在极少次对话轮询的情况下)准确理解我们当前的语言所表达意图。因为,即便是人与人之间,要实现有效的意图沟通也可能会碰到障碍,我们不是有成语对牛弹琴吗?
  • 另一方,随着AIGC的技术路线、prompt工程的演进,二者可能会重塑或者创造出一种新的人类与机器的语言交互模式。正如我们现在见到屏幕就想戳一下,滑一下,我们和智能手交互的方式是被技术和人类能力(如手指的灵巧性)所共同塑造的。

小结

总之,现阶段乃至今后一段较长时间,有意识的提升自己与AIGC交流沟通的能力是一个必须重视的问题。可采取如下措施:

  • 适应自己工作中所要接触的各种AIGC的沟通方式。比如:
    • chatgpt有自己的沟通方式
    • midjourney有自己的方式
  • 在实践中总结问题模式,并总结抽象出行之有效的沟通方式。比如:
    • 学案例要如何生成,有其相对固定的方法
    • 对学生作业文本的评价,有其相对应的方法
  • 善于发现和使用prompt工程中的方法论和工具。这方面目前成熟还不多,我们相信用不了多久会不断出现。
愿各位老师能够找到适合自己的使用方法,工作中能提高效率,早点高质量完工,多出时间自由支配。

推荐阅读


欢迎关注公众号“smarteredu”,原创技术文章第一时间推送。

冯翔
冯翔
副研究员 人工智能教育

研究方向包括人工智能在教育中的应用,学习分析,学习平台等