最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

思维的研究方法

来源:动视网 责编:小OO 时间:2025-09-30 00:55:22
文档

思维的研究方法

第九章思维思维是最高级、最难把握的心理过程之一。人们凭借思维,可以把握那些无法直接感知的事物,理解其中的相互关系,推测其发展,认识其本质。思维的表现形式十分丰富,包括:概念形成、判断、推理、问题解决、决策等,这为思维研究开辟了广阔的天地。早在1911年,桑代克(Thomdike,E.L.)就研究了猫在问题解决过程中的尝试错误学习,而后,格式塔学派的苛勒(Köhler,W.)又研究了猩猩的思维顿悟现象。20世纪50年代起,思维的研究开始涉及深层认知机制方面,如:对问题空间和算子的探讨;对有限理性
推荐度:
导读第九章思维思维是最高级、最难把握的心理过程之一。人们凭借思维,可以把握那些无法直接感知的事物,理解其中的相互关系,推测其发展,认识其本质。思维的表现形式十分丰富,包括:概念形成、判断、推理、问题解决、决策等,这为思维研究开辟了广阔的天地。早在1911年,桑代克(Thomdike,E.L.)就研究了猫在问题解决过程中的尝试错误学习,而后,格式塔学派的苛勒(Köhler,W.)又研究了猩猩的思维顿悟现象。20世纪50年代起,思维的研究开始涉及深层认知机制方面,如:对问题空间和算子的探讨;对有限理性
第九章  思维

思维是最高级、最难把握的心理过程之一。人们凭借思维,可以把握那些无法直接感知的事物,理解其中的相互关系,推测其发展,认识其本质。

思维的表现形式十分丰富,包括:概念形成、判断、推理、问题解决、决策等,这为思维研究开辟了广阔的天地。早在1911年,桑代克(Thomdike, E. L.)就研究了猫在问题解决过程中的尝试错误学习,而后,格式塔学派的苛勒(Köhler, W.)又研究了猩猩的思维顿悟现象。20世纪50年代起,思维的研究开始涉及深层认知机制方面,如:对问题空间和算子的探讨;对有限理性和启发式策略的探讨等。近年来,思维研究领域又兴起新一轮的浪潮,其中有关思维中的无意识过程,以及人工智能方面的研究,是极具活力的热点。前者使人们对思维内部过程的理解更加深入;而后者则广泛用于对各种思维理论的模拟、检验上,以期提供理论上的启发。

第一节思维的研究方法

思维研究的不同历史阶段,有着不同的研究方法。早期的尝试错误说和顿悟说,沿用的主要方法是行为测量,所遵循的事实上是行为主义的研究思路。此后,认知心理学逐渐取代行为主义,研究者们不再将心理学仅仅局限于行为观察,他们认为内省式的言语报告应该同行为测量一样,也可以作到科学化,于是,在这一阶段,言语报告便连同行为测量一起成为两大主要的研究工具。而随着认知心理学研究模式的不断深入,一种着力于整合实验结果以探讨思维的内部心理机制与表征的研究方法——建构认知模型——也应运而生了。

一、行为测量

行为测量(Behavioral Measures)是指研究者通过对被试外显行为的观察或运用各种指标对被试的外显行为的评估来获得思维过程数据的方法。通过对观察数据或行为指标的分析,往往可以推测被试的内在思维过程。它与行为主义着重外显行为的研究思想一脉相承。

行为测量有两个层次:观察数据和行为指标。早期的一些研究,比如:桑代克的尝试错误实验和苛勒的顿悟实验,大多以观察数据作为推测内在思维过程的依据。而随着行为测量的发展,以及研究者对内在思维过程的推断要求更为精密、准确,所以各式各样的行为指标,比如:答对的人数、解题时间等等,便逐渐完善起来。当然,观察数据和行为指标之间并没有截然的分隔,两者主要的区别在于:采用观察数据的实验,往往不对因变量作明确规定,而是笼统地对被试行为作观察;而采用行为指标,则需要在实验设计中规定某些因变量指标,并针对它们进行观察记录。

(一)观察数据

观察数据即对被试行为进行观察后所获得的数据。行为主义的主要研究思想就是要对外在可观察的行为进行观察,而忽略对内部心理机制的探讨。早期的思维研究者们借用了行为主义观察外显行为的思想,获得了许多有关思维的观察数据。然而,他们并未仅仅停留在数据积累上,而是根据所获得的观察数据进行进一步的推断,形成了有关思维的理论。现以桑代克的尝试错误实验和苛勒的顿悟实验为例来说明研究者是如何使用具体的观察数据形成早期思维理论的。这两个实验都采用了动物被试。虽然直到今天为止,仍有部分研究者对于动物是否拥有思维持怀疑态度,事实上这一问题也仍存有争议;但是无论怎样,桑代克和苛勒的工作在思维研究中占据了无可争议的经典地位,并清晰地阐明了行为测量在思维研究领域的应用。

1911年,桑代克以猫为被试研究了思维过程中的尝试错误现象。他把猫关进特制的迷箱中,箱外放有食物,猫必须拉动迷箱中的绳子,才能把门打开,逃出迷箱,得到食物。桑代克观察并描述了猫在迷箱中的行为,又以每次猫逃出迷箱的时间和成功解决问题前所犯的错误作为行为测量的指标。结果发现:在逃出迷箱得到食物之前,猫往往会经历一段在迷箱中乱抓乱咬、四处碰壁的过程,它会尝试各种策略,最终偶然拉动了绳子,从而成功地逃出迷箱得到食物。并且,在经历了十几次同样的试验之后,猫作出正确反应所需的时间越来越短,所犯的错误也越来越少。由此可以推测:猫的问题解决是一种尝试错误的过程,随着问题解决次数的增多,尝试错误的次数随之逐渐减少。这就是桑代克著名的尝试错误说,即将问题解决的过程看成是一种联想学习的过程,带有渐进的性质,在这一过程中,适宜的联系得以建立并通过强化而巩固,反之,不适宜的联系则逐渐消退。值得注意的一个问题是:在此实验中,桑代克观察的主要方面是猫作出正确反应所需的时间和错误次数,这表示早期的观察数据法中就体现了行为指标方法的部分端倪,这两种方法在许多方面存在联系。

针对桑代克的尝试错误说,1913年到1917年期间,苛勒以猩猩为被试进行了一系列顿悟实验。在其中较著名的一个实验里,实验者将黑猩猩关在围栏中,高处挂着香蕉,但是不管猩猩用爪子还是用棍棒都不可能直接够到香蕉。通过对猩猩行为的观察发现:猩猩在进行了很多次失败的尝试后,索性放弃了这个问题,它们或者犹豫不决,或者环顾四周,或者根本就去做其他的事情了。不过实验观察发现,有时在经历了这样一段较长时间的停顿后,猩猩会突然想到解决方法——把围栏中的箱子一个个地堆起来,然后爬到箱子上,得到了香蕉。基于此,苛勒推测问题解决的过程不是盲目地尝试错误的过程,猩猩不需要一次又一次地去尝试够到香蕉,它们看上去更像是停下来思考,或是去做其他的事,而后在某个瞬间,突然顿悟。这种思维过程突变性的假设——顿悟说,有别于桑代克渐进式的尝试错误说。

以上两个以动物为被试的研究,主要依靠行为观察数据,针对问题解决的过程提出两种经典假说,这证明了观察数据在思维研究中的应用价值。当然,随着实验设计理论和思维研究本身的进展,后来的研究者往往偏好运用事前规定的行为指标,做更有针对性的记录。

(二)行为指标

行为测量时所采用的行为指标多种多样,现以思维研究中的酝酿实验和类比实验为例阐述一下它们的运用。

波斯纳(1973)描述了一项酝酿实验。实验所用的问题为:一个人有4条链子,每条链子有三个环。他想把这四条链子结成一个封闭的链圈。打开一个环要花2分,接一个环要花3分。这个人花15分把所有链子结成了一个封闭的链圈,他是怎么做的?实验操纵的一个自变量为酝酿期的长短,即解决问题的两段时间中的延时,在这里“酝酿”被理解成问题解决之前所从事的与问题无关的事,但却对最终的问题解决产生影响的过程。该自变量的三个水平分别为0、15和30分钟。实验采用被试间设计,每个自变量水平下,至少20个被试。另外,为了控制被试在延时期间的行为,研究者还要求他们在延时期间没有思考测验的问题。实验有两个行为指标,一个是被试解决问题的百分率,另一个是解决问题所花费的时间。结果发现:酝酿期为15分钟的被试问题解决成功率高于无酝酿期被试的,并且他们所花费的时间也更短;而酝酿期为30分钟的被试问题解决成功率又高于酝酿期为15分钟被试,并且他们所花费的同样也更短。波斯纳据此推测,酝酿期的长短直接影响了问题解决的效果。

另一个例子是沃森和约翰逊-莱尔德(Wason和Johnson-Laird,1972)所进行的选择作业实验,或称为四卡片问题。实验程序如下:给成年被试看4张卡片,其中两张的正面各有一个字母,一张卡片有元音字母(E),另一张卡片为辅音字母(K);另两张卡片的正面各有一个数字,一张卡片为偶数(4),一张卡片为奇数(7),见图9-1。实验的指导语为“每张卡片都是一面为字母,一面为数字,现在要求你验证一个规则——若卡片的一面为元音字母,那么另一面则为偶数,不过你只能翻两张卡片”。正确的答案是翻卡片“E”和卡片“7”,因为翻卡片“E”可以从正面验证规则正确与否,而翻卡片“7”可以从反面证伪这一规则。实验以做各种回答的人数比率作为行为指标。结果发现只有10%左右的被试答对,却有将近50%的被试回答“E”和“4”。据此,沃森和约翰逊-莱尔德认为被试擅长于从正面验证某一规则,而不习惯于证伪。

图9-1  沃森和约翰逊-莱尔德实验材料

早期,国内也有研究者使用行为指标进行思维研究。比如:朱智贤等(1963)研究了儿童让步关系推理,研究所使用的行为指标为错误率。结果发现二年级(8-9岁)在推理时的错误率为26.5%,三年级(9-10岁)则为19.5%,四年级(10-11岁)为12.5%,五年级(11-12岁)则下降到4.5%。所以,研究者推论四、五年级是儿童掌握让步关系的一个转折期。

综上,用行为测量来推断思维过程是较为科学、有效的。不管是早期的观察数据,还是后来的行为指标,都是从外显的、客观的行为数据来推测思维的某些特征。这种客观性便是行为测量有效性的见证。不过同时,客观性也存在一个重大的问题,那就是只从行为结果入手,而不能揭示行为过程。为了对思维过程有一个更为详细的了解,后来,研究者们又发明了出声思维法。

二、出声思维

思维的另一个研究方法为内省式的言语报告。在思维研究领域,通常会让被试在问题解决或推理的过程中,将其思路用言语报告出来,这种言语报告的方式被称为出声思维(think aloud)。

(一)出声思维的由来

认知心理学对快速的信息加工过程,通常会使用反应时等指标,而对于诸如思维等慢速的信息加工过程,通常使用出声思维等考察形式,因为慢速的信息加工过程持续时间较长,内部操作更为复杂,存在多种选择的可能性,对其进行行为测量几乎是不可能的。比如:一个人在完成一道数学题的思维作业时,他通过哪些内部操作来完成是别人无法直接观察到的,而事后询问所得的答案又常常是不完整、不准确的。克服这种困难的一个有效方法是让他利用外部言语进行思考,即出声思维,使他的思维过程外显化,这样就可以直接观察人的思维过程。

鉴于此,心理学家邓克(1945)首先提出了出声思维法。但是,在方法被提出的初期,它并未受到学术界的关注。直到1972年,纽厄尔(Newell)和西蒙(Simon)将此方法用在了问题解决领域,获得了可喜的成功,出声思维法才受到研究者的广泛关注。出声思维法一般按照以下几个步骤实施:

(1)对被试进行预训练,使他们能顺利地进行出声思维;

(2)给被试一个思维作业,比如:一道数学题或是一种智力游戏,让他们用出声思维的方法来完成作业,同时用录音机记录他们的全部口述;

(3)当被试在进行出声思维的过程中,发生停顿,实验者应及时提醒或询问他们在想什么,不过,除非有特殊的研究目的,并事先做过准备,实验者在出声思维过程中,不应提问,以免干扰被试的出声思维;

(4)将录下的言语报告逐字逐句地整理成文字材料,并对记录进行细致的分析,提炼其中有价值的材料,以分析被试思维的过程及其特点。

所录下的言语报告的分析是上述步骤中最困难的一步,有时被试的报告显得过于杂乱,很难从中找出规律。对此,纽厄尔和西蒙(1972)提出了一种分析被试出声思维言语报告的有效方法——问题行为图。

(二)出声思维的分析——问题行为图

问题行为图可以使研究者直观地看出被试在问题解决过程中所进行的各种操作序列。问题行为图由两个部分组成:(1)知识状态,即被试在某一具体时刻所知的关于该思维作业的全部信息;(2)操作,即被试每次用来改变其知识状态的手段。在制图时,用方框来表示知识状态,用箭头来表示改变知识状态的操作,箭头的方向指出知识状态变化的路线,画时要依次排列,遵循从左到右,从上到下的原则。如果在问题解决过程中出现知识状态的重复,则返回这一状态的原始位置。这样,将一次问题解决作业的言语报告内容用许多方框和箭头表示,就构成了问题行为图,研究者可以通过问题行为图,详细地了解被试所进行的内部操作过程。

现以一具体实例来说明问题行为图的制作过程。纽厄尔和西蒙(1972)将被试对密码问题的言语报告转化成了问题行为图。密码问题即用10个不同的字母分别代表从0到9的一个数码,比如:在下式中,已知D=5,要求找出10个字母所代表的数码,在用数码代替字母后,运用加法法则进行计算,可使该算式成立。

在纽厄尔和西蒙的研究中,一个被试的言语报告记录片段为:

“每个字母只有一个数值。

(这是对实验者提出的问题,他回答‘一个值’)

这里有10个不同的字母,并且其中每个字母有一个数值。

所以,我看到两个D,一个D是5,因此T是零。所以,我想我从写下这里的问题开始。我将写5,5是零。

现在,我还有另外的T吗?没有。但我有另一个D,这就意味着我在另一侧还有一个5。

现在,我有两个A和两个L,它们各在某个地方,而这个R则有3个,两个L等于一个R,当然,我要进1,这意味着R必将是个奇数,因为两个L或任何两个数相加必然得出偶数。而1是奇数,所以R可能是1,3,但不是5,7,9。

(此处出现长的停顿,实验者问:‘你在想什么?’)

现在看G,由于R可能是奇数,而D是5,G必将是偶数。

我现在来看问题的左侧,那里说D+G、哦,还可能加上另一个数,要是E+O必须进1的话,我想我会暂时忘记这一点的。

也许解这道题的最好方法是尝试各种可能的解法。我不知道是否有最容易的办法。”

显然,被试的第一个认知状态为“D=5”,通过对第一列加工的操作“D+D=T”,他进入第二个认知状态“T=0”,然后被试尝试去取一个新列,但是他并未找到T,只在最左列中找到了D,将“D=5”代入,通过这一操作,他进行了第三个认知状态。以此类推,通过这样逐步的分析,我们可以得到如图9-2的问题行为图。

图9-2 一个被试解密码问题的问题行为图片段

(采自王甦等,1992)

在图9-2中,为了便于和O区分,我们将零写作“Ø”。从图中,还可以看出,被试在整个思维的过程中出现了反复,因为状态6和状态4重复,都是“L+L=R”。当在问题行为图中出现了此类倒退的现象时,必须用向下的箭头表示,并另起一行。

问题行为图表明:被试的过程并不是直线式的,而是以一种曲折、迂回的方式前进。被试在思维的过程中,可能会尝试各种路径,并慢慢积累信息。他有时会钻进死胡同,然后,倒退到原始状态,再尝试其他的路径。随着信息积累逐渐丰富,被试的推理也会变得更为有效。在每一时刻,被试关于思维作业的全部知识便构成了他此时的认知状态,他尽量尝试使用各种操作,以进入一个新的状态,逐步达到目标状态。

(三)出声思维的研究实例

傅小兰(1995)以出声思维研究了人们问题解决过程中所使用的策略。研究中所使用的问题是独粒钻石棋游戏。这是一个单人游戏,共有32粒棋子(见图9-3中的黑点)。它的玩法像跳棋,每次动一个棋子,这个棋子必须跳过另一个棋子,而且要跳到空位上,被跳过的那个棋子就被吃掉了。游戏的成绩取决于最后剩下的棋子数,最好成绩是只在棋盘(44处)剩下一枚棋子。独粒钻石棋的棋子分为四组:A组为在24、42、44、46和五个位置上的棋子;B组为在13、15、31、33、35、37、51、53、55、57、73和75十二个位置上的棋子;C组为在23、25、41、43、45、47、63和65位置上的棋子;D组为在14、32、34、36、52、54、56和74位置上的棋子。四组棋子间的关系具有以下性质:(1)A组棋子无法吃掉34、43、45和54位的棋子而走动;(2)B组棋子无法吃掉A组棋子,也不能被A组棋子吃掉,但可以与C组和D组棋子互吃;(3)C组棋子和D组棋子互相垂直,不能互吃,也不能换位,但它们不仅能与B组棋子互吃,而且还能吃掉A组棋子。实验时,让44名被试分别解决独粒钻石棋问题5次。研究者对被试的口头言语报告进行了分析,结果发现被试采用了三种不同策略:(1)“知觉指引策略”,即被试下棋时毫无无计划,而只是基于对目前问题情境的知觉结果来行动,通常是看到哪个棋子能动就移动哪一个。一般这类被试的口语报告多包含“先试试”、“车到山前必有路”、“走一步看一步”等;(2)“选择性搜索策略”,这类被试的口语报告中一般出现此类自述“先把最角上的棋子吃掉”、“要往中间走”、“怎么把边缘的移到中间去?”等;(3)“计划简化策略”,这类被试的口语报告一般为“怎样使4个角一个一个空出来”、“上面一个一个角消灭掉,这么消灭的话没注意中间的”等。被试试图将4个边角上的棋子一块一块消灭,这表现出了明显的计划性,并能保证剩下的棋子集中在中部。

图9-3 独粒钻石棋

(采自傅小兰,1995)

实验者对使用不同策略解决问题的所剩棋子数进行了统计检验,结果三种策略有显著差异,“计划简化策略”所剩棋子数最少,其次是“选择性搜索策略”,最差的是“知觉指引策略”。可见,前两种策略是解题较为有效的策略。实验者还对对5次问题解决中使用三种策略的人数进行了统计,结果如图9-4所示,这一结果表明随着练习次数的增加,能使用有效策略(选择性搜索策略和计划简化策略)的被试越来越多。

图9-4 五次问题解决中使用三种策略的人数

(采自傅小兰,1995)

(四)对出声思维的评价

的确,认知心理学家们在出声思维上下了大功夫,他们极力使言语报告能像行为测量一样有效、科学。通过问题行为图对出声思维进行分析,使得言语报告可以被量化了。比如:问题行为图中向下箭头的个数就是被试在思维过程中倒退的次数,倒退次数越多,可能说明被试在思维过程中使用策略的情况越不稳定;在问题行为图中,所使用的操作总数,则可以作为其思维快慢程度的指标。除了能和行为测量一样,作到科学化外,出声思维的另一个优点在于:掌握被试思维的全过程,这往往是诸如解题时间、错误次数、答对人数等行为测量指标无法作到的。比如:分析被试解一道数学题的思维过程,行为测量也许只能得到被试解题所花的时间和最终成功解题的步骤,而从问题行为图中,我们却可以看到被试开始的一些错误尝试和曾经被否定的错误策略。

然而,出声思维法也有其缺陷:

(1)作为言语报告的一种,出声思维反映的是仅能停留在被试意识层面的东西。而近些年来的一些研究则表示:思维过程并不一定是可以外显的,被试的思维过程完全有可能是内隐的,即被试不知道为什么会得到此类答案,或者不知道自己在问题解决时所使用的策略。

(2)在解决问题时让被试进行言语报告是否会影响到被试的思维?也许为了更清晰地报告某个想法,而未能及时地注意下一想法,而会导致灵感的丢失。不过,也有研究显示出声思维的方式并不会影响思维的正常进程。

(3)言语报告的可信程度到底有多大?出声思维和过去心理学中的内省法有某些相似之处,因此,有关内省法可信程度的争论在出声思维法上再度出现(Nisbett和Wilson,1977)。梅特卡夫(Metcalfe,1986)进行的实验或许可以说明问题。梅特卡夫要求被试边解决问题,边同时对他们接近问题解决的程度进行评价。结果显示:被试的评价很不准确,即当被试表示他们正接近答案时,他们事实上更容易给出不正确的答案!可见,被试的言语报告可能是相当不准确的。尼斯贝特(Nisbett)和威尔逊指出:当要求被试报告口头上很难定义的内容,或是他们为什么或怎样才能作出可靠判断的时候,言语报告往往是不准确的。但是,出声思维要求被试做的是报告他在想什么或是他在做什么,而不是像上述实验一样,要求被试定义他们言语上很难定义的东西。

总地说来,出声思维法既能像行为测量一样作到科学化,又能揭示行为测量所不能揭示的一些问题。然而,有关出声思维是否会干扰思维过程、出声思维是否可信的问题仍存在争论,所以,当以出声思维作为研究方法时,我们必须对结果的解释作到慎之又慎。一般来说,出声思维法较适宜于那些能够为被试自身清楚意识到的思维过程的研究;而针对如近年来受到较多关注的思维中无意识过程的研究,出声思维法就无法揭示出什么了。

三、建构认知模型

随着认知心理学研究的深入,思维的研究需要进行一次方和指导思想上的,从研究诸如顿悟、类推、酝酿等具体的思维现象到真正揭示思维的本质,即思维的心理机制和内部表征形式。在这种背景下,建构认知模型的方法逐渐受到研究者的青睐。建构认知模型是一个方上的概念,它代表的是一种指导思想,而非专指某种具体的方法。研究者往往会尝试各种方法,综合系列实验研究的结果,来建立模型以揭示思维的心理机制和内部表征,并设计实验来检验模型的解释力。

不过,建构认知模型虽然没有一成不变的具体方法,却仍能总结出大致的步骤和脉络。下面的实例对此进行了说明:

(一)实施步骤

众所周知,思维最基本的单元就是概念,或者说是命题或符号系统。思维也常被认为是以某种算法或规则对符号或概念进行一定操作的过程。人们掌握概念的过程,可谓是最基本的思维过程。所以,有关概念结构的模型是对思维的心理机制和内部表征的描述。在此,就以概念结构的原型说为例来说明认知模型范式的实施步骤。

1.先验模型阶段

研究的最终目标是建立具有解释力、得到数据支持的认知模型。但是第一步,是要先建立一个有关思维心理机制和内部表征的先验模型。这里说先验模型,就是指研究者头脑中的理论模型,即还未得到实验验证的思想雏形。

罗希(Rosch,1975)提出一种有关概念表征的认知模型,即概念结构的原型说。他认为概念主要是以原型(prototype),即它的最佳实例,来进行表征的,原型是能够用来最好地说明概念的一个样例。例如:当我们在思维活动中涉及鸟的概念时,我们常会想到鸽子,而不大会想到企鹅或鸵鸟。不过,概念表征除了原型外,还有维量。维量是指范畴成员的代表性程度(degree of category membership),即概念内的其他个体偏离原型的距离。原型和维量的紧密结合就形成了概念。比如,图9-5表示某个人头脑中,概念“鸟”的心理表征模型,原型为“鸽子”,其他的实例和原型间的距离不等。

图9-5 概念表征模型实例

到这里为止,罗希已经提出了一些颇具新意的想法,并对概念表征的机制和结构作了先验的假设。当然,这一模型还远不是研究者最终希望得到的认知模型,但是它能够指导后继的实验研究,在完善该雏形后建构起真正有效的认知模型。

2.实验验证阶段

在先验模型指导下,进行实验验证是认知模型范式的第二个步骤。实验验证,即要通过对各种变量的操纵来获得有利的结果,提出支持或否定先验模型的证据,为模型的进一步完善打好基础。

为了验证概念表征的原型说,罗希(1975)设计了以下实验。实验中,他向被试呈现属于不同语义概念的许多语词实例,让他们就其代表相应概念的程度,由高到低予以等级评定,以1为最高。表9-1列出了部分结果。

表9-1  4个语义范畴实例的优良程度评定的常模

家具等级水果等级机动车等级武器等级
椅子1.5橙子1汽车11
沙发1.5苹果2旅行汽车22
睡椅3.5香蕉3卡车3左轮手3
桌子3.5桃子1小汽车4机关4
安乐椅55公共汽车5.55
梳妆台6.56.5出租汽车5.5弹簧6
转椅6.5柑桔6.5吉普车77
咖啡椅8梅子8急救车8匕首8
摇椅9葡萄9摩托车99
双人椅10油桃10街车1010
柜厨11草莓11大蓬货车1111.5
写字台12葡萄柚12Honda牌汽车

12手榴弹11.5
13浆果13缆车13原子弹13.5
刺刀13.5
(采自Rosch,1975)

可见,每个概念中,各个实例的代表性程度都是不同的,具有最高评定等级的那个实例就是概念的原型或者说是最佳实例。罗希后来的反应时实验也得到了一致的结果,即原型的反应时总是快于其他实例的反应时,代表性好的实例反应时快于代表性差的。

在此结果的基础上,罗希进一步进行了匹配实验。实验中,他向被试呈现一对名称,要求被试尽快说出这对名称是否属于相同范畴,研究者记录被试的反应时间。相同范畴的情况有两种,一种是两个名称完全相同的,如:“知更鸟——知更鸟”,另一种是两个名称属于同一范畴但并非同一个名称的,如:“知更鸟——麻雀”;而范畴不同的情况则是指两个名称属于两个不同范畴的,如:“知更鸟——苹果”。 罗希认为,如果在呈现这些成对的名称以前,将所涉及的范畴(如鸟)告诉被试,即应用启动技术,我们就能弄清概念是怎样表征的,及其编码情况。如果先呈现的范畴所引起的表征是范畴的原型,那么更接近的那些名称将有更大的易化效应,即反应更快。罗希从9个范畴中选择了分别代表高、中、低3种范畴成员代表性程度的项目,如在家具中,床为高,梳妆台为中,椅子为低。除了使用字词材料外,罗希还使用了相应的图片材料。实验有两种条件:有启动词和无启动词。结果如图9-6所示。

   图9-6 不同范畴成员代表性的项目的反应时

   (采自Rosch,1975)

可见,启动词能加速诸如“麻雀——麻雀”等代表性高的项目的反应,而不影响诸如“知更鸟——知更鸟”等代表性中等的项目,但会延缓诸如“企鹅——企鹅”等代表性差的项目的反应。对于范畴相同的项目对而言,启动会加速高(“麻雀——麻雀”)、中(“麻雀——知更鸟”)、低(“麻雀——企鹅”)三类代表性的项目对的反应。这一结果验证了罗希最初的假设。

总之,罗希的两个实验分别验证了原型和维量的存在。

3.模型完善阶段

在对认知模型进行实验验证之后,认知模型的建构就可以进入第三个阶段——对模型进行完善。比如:起初,罗希认为不同地区、民族、历史时期乃至文化背景和群体构成等方面的特点都会造成概念原型上的差别。但是后来,罗希在新几内亚对土著居民进行了颜色识记实验。结果发现:虽然那里的土著居民没有西方的颜色分类名称,但是他们在识记西方的各颜色范畴的原型时,仍然要快于识记其他边缘颜色,而且效果也较好,无论短时记忆或长时记忆都是如此。因此罗希在新的实验事实基础上,对其原有的模型进行了修正,提出原型可能是由基本的神经生理过程决定的。

至此,模型的建构基本完成,经过修改完善的模型将回到实验验证阶段,重新经受实证研究的考验,然后再完善。在这种不断循环的研究程序中,认知模型将越来越具解释效力。

(二)评价

建构认知模型作为思维研究的一种方,是有它的优点和局限性的:

1. 优点

它的优点主要表现在:

(1)符合如今科学发展的趋势,即先依靠人的理性提出某个观点,然后再以实践去加以验证。而不是像原始的科学一样,依靠对经验的归纳来得出科学理论。这就是为何认知心理学如今受到广大研究者青睐的原因。

(2)有利于揭示思维的本质及其内在的心理机制,而不仅仅停留在现象的层面上。比如:概念表征的原型说能揭示人类不同概念进行不同判断的真正原因。

(3)对人的思维过程进行某种模型上的猜测与拟合是十分有应用价值的。比如:原型说能为小学教育提供借鉴:教师上课时的举例应尽量做到原型化,即尽量能和学生头脑中的概念原型相匹配。

    2.局限

认知模型范式的局限主要表现在:

(1)先验模型有时可能不可靠。基于先验模型进行实验研究,并将实验的结论解释为先验模型的预期有时是不正确的。因为,在摆脱先验模型束缚的情况下,我们也许对实验结论做出不同的解释。

(2)有时难以找到具体的实验方法可以验证先验模型。有些研究者在设计模型时,往往会将模型设计得过于复杂,这给实验验证带来了难度。

(3)不是任何的思维过程都能找到一个认知模型与之相匹配的。比如:内隐问题解决过程,被试在问题解决过程中操纵的到底是哪些算子呢?问题解决各个时刻的基本认知状态又是怎样的呢?由于被试无法外显,我们根本无法根据经验来建立有效的模型。

回顾本节内容,思维研究的方法,经历了从行为测量、出声思维到认知模型建构的演变。然而这种演变并非一种方法对另一种方法的取代,而是思维研究方法的不断细化和精致化的结果——也就是说,现代思维研究往往会提出可检验的认知模型,也会在实验中观察行为指标,同时又是适当应用被试主观报告的结果。正因为多种方法的综合应用,才使得思维研究在各个领域取得进展,这也正是下一节将着重介绍的内容。

第二节思维研究的领域

自从20世纪初以来,思维的研究积累了不少资料,下面就将对其中的主要领域作一番介绍。就像上一节提到的那样,由于动物思维仍然是一个有争议的话题,因此本节内容着力于阐释以人为被试的思维实验研究中的精彩部分,主要涉及概念的形成、问题解决、推理和决策等。

一、概念的形成

一些研究者认为,概念是思维的最基本单元,而思维正是以某种算法或规则对概念进行操作的过程。于是概念形成作为最基本的思维过程,得到了广泛研究。1956年,布鲁纳、古德诺(Goodnow)和奥斯丁(Austin)提出了假设检验说,描述了概念形成的过程。这一理论的提出激发了大量研究者对概念形成的研究,为概念的形成真正成为现代思维研究的主要领域奠定了基础。

(一)假设检验说的主要观点 

布鲁纳、古德诺和奥斯丁的假设检验说的主要观点为:人在概念形成的过程中,需要利用现在获得的和已存储的信息来主动提出一些可能的假设,即设想所要掌握的概念可能是什么,这些可能的假设组成一个假设库。在概念形成的实验中,对任一刺激作出反应之前,被试都必须从他的假设库中,取出一个或几个假设,并根据这一假设作出反应,即对这一假设进行检验。如果被试得到正确反馈,他们会继续延用这一假设,否则,被试将舍弃这一假设,并到假设库中再寻找另一假设来代替现有的假设,如此这样反复,直到某个正确的假设被反复验证为正确时,概念便形成了。

不过,布鲁纳、古德诺和奥斯丁认为假设检验过程中最重要的一点是形成或检验假设并不是没有规律的。被试的假设检验过程可以被看成是运用有目的策略的过程。这些目的包括:(1)从每一个决定中获取最多信息;(2)使任务的压力保持在可处理的限度以内;(3)调节在规定的时间或活动范围内,未能掌握概念的风险以及作出一个决定所带来的其他风险。有目的策略的运用是假设检验说的核心,也是人在假设检验过程中主动性的体现。

(二)实验验证——人工概念实验

假设检验说的实验验证离不开一种新颖的实验材料——人工概念——的发明。人工概念是布鲁纳、古德诺和奥斯丁(1956)为了验证假设检验说所阐述的概念形成过程而发明的。人工概念指人为制造出来的,并没有实际内涵的某种概念。在人工概念实验中,实验材料是画有图形的卡片,如图9-7所示。这些图形可以在四个维度上变化:形状、颜色、数目和边框。每个维度又分为3个水平,即各有3个属性或值。形状维度有十字、圆形和方形3个属性;颜色有绿、黑、红三个属性;数目有1、2、3三个属性;边框也有1、2、3三个属性。每张卡片都具有这4个维度的各一个属性,所以每张卡片都和其他卡片在4个维度上不同。这样的卡片共81张(3×3×3×3)。

图9-7 人工概念实验材料

(采自Bruner,Goodnow和Austin,1956)

以人工概念为实验材料,布鲁纳等进行了一项经典的实验,称为人工概念实验。在实验前,实验者必须事先规定某个维度的某一属性(如:红色)或几个维度的属性(如:绿色方形)为某个人工概念的特有属性,即这一人工概念由这些维度和属性构成,这些维度和属性被称为有关维度和有关属性,而其他维度和属性被称为无关维度和无关属性。具有所规定的全部有关属性的卡片就是人工概念的肯定实例,否则就是否定实例。实验开始时,主试告诉被试:本实验有一个特定的概念,这个概念是由某一属性或某些属性组成的,要求被试通过实验过程来发现这个概念。在实验中,主试首先取出一张肯定实例卡片给被试看,并明确告知这是肯定实例,被试则要从堆在他面前的所有卡片中,根据他自己的想法来选取属于这个概念的其他实例,每次被试选取之后,主试都要给予被试选择正确与否的反馈。实验一直进行,直到被试的选择不再出错,即说明被试形成了概念。结果发现:被试所做的选择不是任意的,而是有着一定顺序,按照一定的策略进行选择。布鲁纳等确定了被试在假设检验过程中使用的4种策略:(1)同时性扫描,被试根据主试所给的第一个肯定实例的部分属性来形成多个部分假设,比如:“一条边框”或“两个图形”。在实验过程,他们会记住这些假设,在依照其中一个假设选取卡片后,将主试给予的反馈与这些假设进行对照,看究竟哪一个假设是正确的;(2)继时性扫描,这一策略也应用于部分假设。它与同时性扫描的区别在于一次只检验一个假设;(3)保守性聚焦,这个策略应用于总体假设的检验。总体假设指根据主试所给的第一个肯定实例的所有属性来形成假设,比如:“一条边框、两个图形、红色和方形”。所谓保守性聚焦就是以第一个肯定实例的全部属性为焦点,接下来选取的卡片都对准这个焦点。具体做法是每次选取一张与焦点只有一个属性不同的卡片,如果这次选取的卡片被验证为正确的,那么这个属性就不是有关属性,相反,如果卡片被否定,那么这一属性则不一定是有关属性;(4)博弈性聚焦,这个策略也是用于总体假设检验的。它和保守性聚焦的不同在于,它一次改变焦点卡片一个以上的属性。

人工概念实验对概念形成的假设检验说提供了支持,此后的研究者又设计了新的实验,从其他角度对假设检验说进行了验证。

(三)实验验证——渐变-突变实验

基于假设检验说,杨治良(1986)对概念形成的突变、渐变性进行了实验探讨。实验选用的材料为早期包塞莱特(Bouthilet,1949)实验中所用的英文材料,及据此原理所制作的汉字材料,见表9-2和表9-3。左面一个为关键词,右面五个为选择词。例如SACRIFICE:word、urge、exit、came和safe。实验时要求被试从这五个选择词中选择某一个词。正确的选择总是各组成的字都包含在关键词中的那个选择词。如上例中的词safe就是正确答案。当这一规则一旦被发现之后,该被试就能在以后的全部尝试中保持正确。汉字材料则以笔划代替英文字母,按同样原理制成。实验以72名中国人和72名美国人为被试。实验中,被试的任务是在每张卡片上从五个选择词中找出一个和左面关键词有关的词,被试每次选择之后,主试都反馈正确答案。

表9-2 英文假设检验模型举例

关键字选   择   字正确答案
ABCDE
FEATUREearSongdatehaltdullA
BULLETINraftSlidetilelaidhireC
OINTMENTforthMintsureneatsaneB
OPENINGslipToldbluepinegapD
INFLUENCEsureNewplayfearlifeE
(采自杨治良,1986)

表9-3 汉字假设检验模型举例

关键字选   择   字正确答案
ABCDE
广E
穿D
B
A
C
(采自杨治良,1986)

实验者观察了被试在概念形成过程中的行为,结果发现被试的确是积极地提出假设,并通过作出合适的选择,来对自己的假设进行检验。此外,实验者还依据被试在概念形成过程中的正确率制作了集体学习曲线,即以每个被试自己的学习总遍数作100%,把转换成百分数的尝试数作横坐标,同时以最大值的成绩分数作100%,把转换成百分数的成绩作纵坐标,画出曲线。结果发现曲线的走势分为两部分,第一部分正确程度徐徐上升,呈渐进式,第二部分急剧上升,呈突变式。回归分析也得到了类似的结果。由此,研究者推测概念形成是先渐变,后突变的过程。

渐变-突变实验对概念形成的假设检验说提出了更直接的证明,由于突变部分的存在,研究者将更有理由相信,被试的概念形成过程,正如假设检验说所描述的那样。

二、问题解决

问题解决是最为普遍的一种思维形式,最早的尝试错误说和顿悟理论的争论就属于问题解决的研究范畴。由于在第一节中,已经涉及了出声思维和问题行为图的探讨,并且在第四节中,我们还将介绍问题解决的启发式策略,所以在这里仅就问题解决研究中一个有意思的专题——功能固着现象——进行探讨。

问题解决的过程中,往往会出现功能固着(functional fixedness)现象。所谓功能固着就是指在问题解决过程中,只看到某种事物的典型功能,而看不到该事物其他方面作用的现象。例如,在人们的头脑中,习惯性地认为笔是用来写字的,螺丝刀是用来拧螺丝的,而不会想到笔有时也可以拧螺丝,或者螺丝刀有时也可以在沙土上刻字。功能固着研究的最重要环节是选择典型问题,以及如何应用典型问题进行具体的实验研究。

(一)典型问题

要研究问题解决,首先就是要设计问题情景,功能固着的研究也不例外。不过,相对于其他的问题解决研究而言,适用于功能固着研究的问题情景更难于设计。功能固着研究的问题情景的设计需要注意以下几点:

(1)问题的成功解决必须涉及某一事物的特殊性用途,而不是通常用途。这些特殊用途是被试很难考虑到的,或者说很难立即想到的;

(2)问题情景设计必须要诱发被试的习惯性思维。比如:如果要使被试将盒子的功能固着到容器上,那么就可以通过在盒子内放其他物品来暗示被试;

(3)最后一点,是在所有问题情景设计中,都必须注意的,即问题的难度。问题情景的设计不易过难,问题解决方案必须是被试通过适当的努力就能发现的,否则,在所有被试的身上都会出现功能固着效应,即地板效应出现,这时,实验结论常常难以解释。问题情景的设计也不易过易,否则会出现天花板效应。

只有满足上述三点的问题情景,才是功能固着研究较为适宜的实验材料。以下举两个功能固着研究的典型问题。

1.绳子问题

功能固着的一个典型问题是梅尔(Maier,1931)的绳子问题。问题的具体情景是这样的:让被试进入一个房间,房间的天花板上垂下来两根绳子,房间里放有两个钳子和一些其他的物品。问题的要求是把两根绳子系到一起,但是两根绳子相隔得很远,使得被试不可能用两手同时抓到两根绳子。绳子问题的正确解法是把钳子系到其中的一根绳子上,然后让它像钟摆一样摆动起来,当两根绳子靠得很近的时候,再把它们系到一起,问题就解决了。解决此问题的关键是改变对钳子的功能固着,即不再认为钳子只是工具,而是有其他用途的,比如可以作为钟摆的摆锤。绳子问题之所以能够成为典型问题,是因为它满足三个条件:(1)问题解决方案涉及某一事物的特殊功能——钳子作为摆锤的功能;(2)问题情景能诱发被试的习惯性思维,没有直接将钳子系在绳子上,钳子给人的感觉就是夹东西的;(3)问题难度适宜,具有可解性,梅尔的实验证明虽然大部分被试未能解决问题,但还是有少量被试在此情景中,顺利地解决问题了。

2.盒子问题

功能固着的另一典型问题是邓克(1945)的盒子问题。问题的情景是这样的(如图9-8):在桌上放一些大头针、一些火柴、一根蜡烛以及三个火柴盒大小用纸板做的盒子,要求被试把蜡烛安置到门上。此问题的正确解决方案是用大头针将盒子钉在门上,然后把蜡烛底部融化后粘在盒子上(如图9-9)。盒子问题也满足典型问题的三个要求:(1)问题解决方案涉及某一事物的特殊功能——盒子作为蜡烛平台的功能;(2)问题情景能诱发被试的习惯性思维,事实上,在实验中,邓克会在盒子中放一些其他物品,强化被试将盒子作为容器的习惯性思维;(3)问题难度适宜,具有可解性,邓克的实验证明虽然的确有被试未能解决问题,但也有被试在此情景中,顺利地解决问题了。

图9-8 盒子问题

(采自Lazerson,1975)

图9-8 盒子问题的正确解决方式

(采自Lazerson,1975)

(二)实验研究

有了典型的问题,研究者便可以进行具体的实验研究了。邓克(1945)采用盒子问题进行了功能固着研究。为了引起被试不同水平的功能固着,他设计了三种实验处理条件:(1)控制条件,三个盒子是空的,它和大头针、火柴以及蜡烛等实验材料一起摆放在桌子上;(2)功能固着条件,三个盒子里分别装有大头针、火柴和蜡烛;(3)中性物条件,三个盒子里分别装有与实验无关的钮扣等其他与问题解决无关的物品。其中,条件(2)和条件(3)强化了盒子作为容器的功能,即能加强被试本身的功能固着。实验采用被试间设计,每个被试只接受一种实验处理。每个条件下有7名被试。

实验结果如表9-4所示。可见,由于在控制条件下,盒子没有被作为容器呈现给被试,因此盒子作为容器的功能被弱化了,而在条件(2)和条件(3)中,盒子里面都装了东西,因此被试会固着于盒子作为容器的这一功能,从而未能成功地解决问题。

表9-4 在三实验条件下解决问题的被试人数

条件盒子所材料解决问题人数(n-7)

控制条件

功能固着条件

中性条件

空盒

盒子里装着蜡烛、火柴和大头钉

盒子里装着无关的材料(钮扣等)

7(100%)

3(43%)

1(14%)

(采自Duncker,1945)

然而,后来有研究者对邓克的研究结果提出了质疑。亚当森(Adamson)认为邓克的实验未将速度-准确性权衡考虑在内,控制条件中,解决问题的人数多,可能并非是因为功能固着的倾向较弱,而仅仅是由于他们解决问题花了更多的时间,而功能固着条件和中性条件下,解决问题的人数少,仅仅可能是由于被试没有耐心解决问题,或者给予被试的时间过少。所以,为了深入探讨,亚当森在邓克实验的基础上,进一步实验。他的实验涉及三个问题:盒子问题、回形针问题和螺丝锥问题。自变量有两个水平,即功能固着条件下有经验的被试和控制条件下的无经验的的被试,每个被试组为26-29人。实验有两个因变量指标:一个是20分钟内能解决问题的被试的百分率;另一个是被试成功解决问题所花费的时间。

结果显示:对于盒子问题而言,在控制条件下,有86%的被试解决了问题,而在功能固着条件下,只有41%的被试解决了问题,这一点和邓克的实验结果一致。然而,回形针问题和螺丝锥问题的实验结果却很有意思:几乎所有的被试都解决了这两个问题。究其原因可能是由于存在天花板效应,20分钟对于解决这两个问题而言时间太长了。所以从这点意义上来说,20分钟的时间使得回形针问题和螺丝锥问题违背了功能固着研究问题设计所必须注意的第三点——问题过于简单。此时,以成功解决问题的被试人数作为因变量是不可靠的,或者说是不敏感的,而以解决问题的时间作为因变量可能可以避免天花板效应的出现。结果如图9-10所示,不同实验条件下,被试的反应时间有明显的差异,控制条件下的被试比功能固着条件下的被试解决问题的速度要快得多。可见,功能固着的程度的确会影响被试解决问题的速度和正确率。

图9-10 在控制和实验条件下被试解决螺丝锥问题和回形针问题所花的时间

(采自Adamson,1952)

功能固着的实验研究,体现了人们在问题解决中对物体功能的理解往往囿于习惯,无法突破思维定势的特点,触及了问题解决的某些固有机制。在本章后面的内容中,还将涉及到问题解决研究的更多更深的内容。

三、推理

推理是从已知的或假设的事实中引出结论。推理其实是一种特殊的问题解决——逻辑问题的解决。推理实验研究发现,虽然正确完成推理任务需要依靠逻辑,但真实的推理过程却往往存在非逻辑的部分。通过将人的推理过程与标准逻辑规范进行比较,研究者有望查明推理是否偏离逻辑规范及其原因,从而深入地了解人的推理过程。目前的实验研究已经得到许多有趣的结果,下面是其中具有代表性的一部分:

(一)启发式策略

启发式策略是指人们在推理任务中,往往采用的一些推理规则;这些规则不一定遵循标准逻辑规范,但在生活情景中也能帮助人们作出快速的、基本有效的推断。卡纳曼和特弗斯基(Kahneman和Tversky,1972,1973)总结了三种重要的启发式策略:代表性启发法(representativeness heuristic)、可得性启发法(availability heuristic)和调整启发法(adjustment heuristic)。

代表性启发法是指人们倾向于根据样本是否代表总体来判断其出现的概率,愈有代表性的,被判断为愈常出现。在卡纳曼和特弗斯基的一项实验中,他们给被试简要介绍某个人的特征,并说明这人是从100人中随机抽取出来的,告知第一组被试这100人中有70人是工程师,30人是律师,而告诉第二组被试这100人中70人是律师,30人是工程师,要求被试判定所介绍的那个人是工程师(或律师)的概率有多大。其中一例介绍为“杰克是45岁的男性,已婚并有4个孩子;他一般显得保守、谨慎、有事业心;对政治和社会问题不感兴趣,绝大部分业余时间都花在家庭木工、驾帆船和数学游戏上”,这一介绍极像工程师,与律师的形象相去甚远。结果发现:两组被试都判定该人为工程师的概率约为0.90。显然,被试只是依据介绍人物特征的代表性来进行判断的,而没有考虑事件的基准率信息,也即工程师在两组中所占的不同比例。

可得性启发法是指人们倾向于根据一个客体或事件在知觉或记忆中的可得性程度来评估其相对频率的,容易知觉到的或回想起的常被判定为更可能出现。例如,要求人们回答:字母K在英文单词里是常出现在第一个字母位置还是第三个字母位置?绝大多数人认为字母K常出现于英文单词的开头。但是实际上,在英文里,第三个字母是K的单词数量是以K字母起头的单词数量的3倍。人们之所以认为字母K常出现于英文字的开头,显然是由于人们容易回忆出以K字母开头的单词,而不容易回忆出K出现在第三个字母的单词。

调整策略是指以最初的信息为参照来调整对事件的估计。在判断过程中,人们最初得到的信息会产生“锚定效应”(anchoring effect),制约对事件的估计。例如,对被试提出下列两个问题中的一个:

问题1:8×7×6×5×4×3×2×1=?

问题2:1×2×3×4×5×6×7×8=?

要求被试在5秒内估计出其乘积。在如此短暂的时间内,被试基本不可能得出真正的答案。结果发现,被试对第一道题的乘积估计的中数为2250,对第二道题的乘积估计的中数是512。两者的差别很大,并都远远少于正确的答案即40320。可以设想,被试在对问题作了最初的几步运算以后,最初几步运算的结果产生了“锚定效应”,被试仅以获得的初步结果为参照来调节对整个乘积的估计。由于两道题的乘数数字排列不同,第一道题的最初几步的运算结果大于第二道的,因而其整个乘积估计也较大。

有关启发式策略的研究,揭示了人们在处理实际问题时所遵循的并非一定是逻辑推理规则,对这些启发式形成的原因分析,将有助于研究者理解思维推理作为适应性机能的发生和发展。

(二)推理模型

除了探讨人们在推理时使用的一些启发式规则,研究者们还进一步探讨了推理模型。

1.国外研究者提出的模型

国外有关推理模型的研究主要集中于三段论推理。查普曼和查普曼(Chapman和Chapman,1959)曾提出三段论推理的换位模型。他们认为,人在三段论推理中所犯的错误是由于错误地解释了前提。比如:人们往往将一个全称肯定前提解释为逆转亦真,即认为“所有A是B”意味着“所有B是A”,对一个特称否定前提也是这样,将“一些A不是B”的意义理解为也包含“一些B不是A”。例如,给被试呈现下述两个前提和5个备选的结论,要求他们从中选择一个正确的结论:

所有罪犯都是精神病患者

一些精神病患者是酗酒者

因此(1)所有酗酒者都是罪犯

(2)没有一个酗酒者是罪犯

(3)一些酗酒者是罪犯

(4)一些酗酒者不是罪犯

(5)上述结论均不正确

被试通常会选择(3),而实际上只有结论(5)才是正确的。显然,这是由于被试错误地解释了所呈现的全称肯定前提,将“所有罪犯”与“所有精神病患者”等同起来,认为逆转亦真。

约翰逊-莱尔德(1983)提出的心理模型(Mental Model)更多地涉及了推理的内部过程和心理机制。该模型认为:三段论推理的第一步是构成一个将两个前提中的信息结合起来的心理模型,在这些前提的基础上建构起来的心理模型通常提示某个结论,然后通过搜索与该结论不相容的其他替代的心理模型来评价该结论的真实性。如果搜索不到,即没有足以破坏该结论的对前提的其他解释,那么这个结论就是真实的。约翰逊-莱尔德曾经举过一个例子,前提为:

所有养蜂人都是艺术家

没有化学家是养蜂人

Johnson-Laird认为一个比较明显的心理模型是:

化学家

化学家

……………………

养蜂人=    艺术家

养蜂人=    艺术家

           (艺术家)

           (艺术家)

在这种模型中,点线表明化学家和养蜂人是不同范畴的人;等号表明每个养蜂人也是艺术家;括号表示有某些其它非养蜂人艺术家。这个模型提示的结论是“没有一个化学家是艺术家”。 约翰逊-莱尔德的实验中,60%被试得出了这个结论。如果被试继续寻找与该结论不相符合的其他模型,就会发现这一结论是错误的。有些被试的确找到了第二个心理模型,即:

化学家

化学家=    艺术家

……………………

养蜂人=    艺术家

养蜂人=    艺术家

           (艺术家)

这一模型否认了第一个模型得出的结论。在第二个模型中,可以是“一些化学家不是艺术家”。实验中,有10%的被试确实认为这一结论是正确的。不过,如果被试继续寻找与该结论不相符合的其他模型,就会发现这一结论也是错误的。如此继续下去,就能找到正确的结论。

2.国内的研究

林崇德等也探讨了人类推理中所使用的模型。他们曾研究了儿童在三项系列问题中所使用的推理模型(李红和林崇德,2001)。所谓三项系列问题就是一种传递推理,如:黑狗没有白狗小,黄狗比白狗小,谁最大。他们假设被试在推理时,可能使用如下四种模型:(1)空间模型,被试典型言语报告诸如:“黑狗没有白狗小,就是白狗更小,所以,黑狗大白狗小,黑狗大于白狗;黄狗比白狗小,就是黄狗小白狗大,所以白狗大于黄狗;最后,我把它们排在一起就是:黑狗、白狗和黄狗,一个比一个大,你的问题是谁最大,当然是黑狗最大了”;(2)语义-空间混合模型,典型言语报告诸如:“‘黑狗没有白狗小’就是黑狗和白狗比小,这里是黑狗小但白狗更小,所以,白狗小;‘黄狗比白狗小’就是白狗小但黄狗更小;加上前面一句,就是白狗小、黑狗小、黄狗更小,嗯,没有最大的,我来把三条小狗重新排列一下:第一句话说的是黑狗小白狗更小,第二句话说的是白狗小黄狗更小,所以,从左到右是黑狗、白狗和黄狗,它们越来越小,排在最左边的是最不小的,就是黑狗,所以最大的是黑狗”;(3)语义模型,典型言语报告诸如:“‘黑狗没有白狗小’,就是黑狗也小,但白狗更小,反过来就是黑狗大白狗小;‘黄狗比白狗小’就是白狗小,但黄狗更小,反过来就是白狗大黄狗小,你的问题是谁最大,……刚才是黑狗大,现在是白狗大黄狗小,嗯……刚才除黑狗大外,还有白狗小,对了,黑狗大白狗小,白狗大黄狗小,当然是黑狗大了”;(4)枢纽项比较模型,典型言语报告诸如:“‘黑狗没有白狗小,黄狗比白狗小’,这里的白狗是重复出现的,所以白狗不是最大的也不是最小的,而是第二大,最大或最小只能在黑狗和黄狗中找;‘黑狗没有白狗小’,就是黑狗比白狗大,这里是黑狗比白狗大,而白狗是第二大的,所以不用说,黑狗最大,黄狗最小”。

实验设置了两个条件:自由推理和实质描述推理,前者是指在不告诉被试问题实质的情况下,让被试进行推理,而后者是指在告诉被试问题实质的情况下,让其进行推理,即告诉被试此类推理的实质是传递问题,找到中间项后,便能顺利解题。结果发现,在自由推理中,个体解决三项系列问题的心理模型的发展经历了4个阶段:6-7岁时,被试主要采用空间模型和语义-空间混合模型,这时以空间模型的成熟为主要特征;8-10岁时,被试主要采用空间模型、语义-空间模型、语义模型,这个阶段以语义-空间模型的逐步成熟为主要特征;11-13岁时,被试能采用所有上述4种心理模型,这个阶段的主要特征是语义模型达到成熟水平,并在前 3种心理模型的基础上出现了枢纽项比较模型;16-19岁时,前 3种心理模型已经成熟,枢纽项比较模型得到较快发展。在实质描述推理中,个体解决三项系列问题的心理模型的发展经历了5个阶段:6岁时,只能采用空间模型和语义-空间模型,并且这一年龄组80 %的被试采用空间模型;7-9岁时,能采用空间模型、语义-空间模型、语义模型,这个阶段的主要特征是语义-空间模型趋于成熟,同时出现语义模型;10-11岁时,能采用所有4种模型,这个阶段的主要特征是语义模型达到成熟水平,同时出现了新的枢纽项比较模型;13岁左右,枢纽项比较模型达到成熟水平;16-19岁时,枢纽项比较模型逐渐超过其他 3种心理模型,成为居主要地位的核心模型。

综上,推理的实验研究和此前介绍的功能固着实验一样,都揭示出人类思维过程中的某些规律性方面。随着研究者逐渐建立起推理的认知模型,人类逻辑推理能力的核心——推理的内部机制问题,正在被慢慢破解。

四、决策

决策是指在分析所获得信息的基础上作出决定的心理过程。传统的决策研究者通常持有“完全理性”观点,即认为决策者可以基于对所掌握信息的全面权衡,而作出最优的抉择。直到1947年,西蒙考虑到了人的心理因素在决策中的作用,提出了“有限理性”观点,研究者们才逐渐开始怀疑“完全理性”观点。下面介绍这两种观点各自的代表理论及其研究。

(一)期望效用理论

基于“完全理性”观点的决策理论,往往用数学模型来模拟人的决策过程。比如:用多重回归模型来拟合人的经济决策行为(McCloskey,1985),用贝叶斯公理来拟合猎人判断猎物是否会出现的行为(Anderson,1990)。其中,最具代表性的要属诺依曼和摩根斯腾(Neumann和Morgenstern,1947)提出的期望效用理论(expected utility theory)。

期望效用理论认为:决策者一般选择期望效用值最大的那项备择方案。期望效用值可以用备择方案的结果发生概率与该备择方案的效用值之间的函数来表示。假设在当前状态下,采用的决策方案为Aj,产生的可能结果为Sj,每一结果的效用值是U(Sj),概率为Pj,则该决策的期望效用值为E(Aj)= PjU(Sj),期望效用值最大的方案即为当前的最佳决策。

例如:假设有两家公司(公司1和公司2)提供了两份工作,初始工资相同,在公司1工作第一年工资增长20%的机会是50%;在公司2工作第一年工资增长10%的机会是90%,决策者会选择哪家公司呢?根据期望效用理论,公司1的效用值U(S1)=20%,概率P1为50%,期望效用值E(A1)= P1U(S1)=50%×20%=10%,公司2的效用值U(S2)=10%,概率P2为90%,期望效用值E(A2)= P2U(S2)=90%×10%=9%,所以,决策者会选择公司1。

不过,后来,受到“有限理性”观点的影响,研究者们认为人们在决策的过程中,并不是完全按照客观存在的效用值和概率计算期望效用值,效用值和概率的估计的确会受到人主观因素的影响。由此,萨维奇(Savage,1954)提出了主观期望效用理论(subjective expected utility theory),该理论用主观概率代替了期望效用理论中的客观概率,用主观效用值代替了期望效用理论中的效用值。然而,主观效用理论并未彻底摆脱“完全理性”观点的支配,仍然希望用数学模型来解释人的决策过程。

(二)前景理论

相对于“完全理性”观点,“有限理性”观点则认为人不可能全面地考虑问题,并作出最为合理的决策,在现实生活中,人们决策的有效方法是靠以往的经验。这一观点最具代表性的理论是卡纳曼和特弗斯基(1979)提出的前景理论。

卡纳曼和特弗斯基做了一系列心理实验研究,发现人的实际决策行为和期望效用理论的预期有所偏离,并且这些偏离都是系统的、有规律的。因此,卡纳曼和特弗斯基提出了前景理论,对这些系统偏离进行解释。下面是该理论的一些重要组成部分:

1.回避损失(loss aversion)

回避损失是指损失的效用要比等量收益的效用得到更大的权重。例如:卡纳曼和特弗斯基进行的一项实验。实验1的问题是:由于受到市场变化的威胁,某公司的领导人遇到了一个两难问题。他必须得采取一些行动,否则公司的3个制造厂就得倒闭,所有的6000雇员失业。现在有两个备择方案:

方案1:执行该方案可以保存一个工厂,保留2000个雇员。

方案2:执行该方案有1/3的概率可以保留全部的3个工厂和6000个雇员,但是2/3的概率是全部工厂倒闭,6000个雇员全部失业。

实验要求被试选择其中一个方案,结果表明大部分被试选择了方案1。在实验2中,他们将方案改写成下面的形式。

方案3:执行该方案必定损失2个工厂,损失4000个雇员。

方案4:执行该方案2/3的概率是损失全部3家工厂和6000个雇员,但仍有1/3的概率没有任何工厂倒闭,也没有雇员失业。

此时,大多数被试选择的是方案4。如果按照期望效用理论,实验1和实验2的4个备择方案都具有相同的期望效应值,被试应该无法作出抉择才对。可是,为何两次实验的结果截然不同呢?卡纳曼和特弗斯基认为两次实验结果都表示被试回避损失的倾向,实验1中,方案2损失量显得更多,而实验2中,方案3损失量显得更大。根据诸如此类实验结果,卡纳曼和特弗斯基总结了一条损失-收益函数曲线,见图9-11。当收益逐渐增加时,价值增长很少,而当损失增加时,价值却降得很快。

                            价值

       损失                               获益

图9-11 损失、收益价值函数

(采自Kahneman和Tversky,1984)

2.参照效应(reference dependence)

参照效应指人们一般是依据某一参照点来定义价值,而不是依据纯价值进行决策。例如:卡纳曼和特弗斯基让两组不同的被试分别回答以下两组问题:

第一组:假设你现在已经有1000美元,除了你所拥有的之外,现在你可以在下面两项中选择一项。

方案1:一定可以得到500美元。

方案2:50%可能获得1000美元,50%可能一无所有。

第二组:假设你现在已经有2000美元,除了你所拥有的之外,现在你可以在下面两项中选择一项。

方案1:一定可以得到500美元。

方案2:50%可能获得1000美元,50%可能一无所有。

结果,第一组中84%的被试选择方案1,而第二组中69%的被试选择方案2。就因为被试的参照点不同,决策结果完全不同,已有1000美元的被试较为保守,而已有2000美元的被试较为冒险。

3.捐赠效应(endowment effect)

捐赠效应是指对于获得本不属于自己财产的东西,人们倾向于给予高的评价。在卡纳曼等的一项实验中,他们给第一组被试每人一个杯子,第二组被试则什么都不给,第三组被试可以选择要杯子还是要等量的钱。结果发现:第一组拥有杯子的被试期望以不低于7.2美元的价格卖出杯子,而第二组被试则期望以2.87美元的价格得到杯子,第三组被试对杯子的估价为3.12美元。卡纳曼将此解释为:拥有杯子的被试获得了本来不属于自己的东西,由于不想放弃,所以对此样物品估价很高。

思维研究的领域十分广阔,思维这种高级心理机能渗透于人类生活的每个角落。伴随着思维研究的逐步深入,一些新的话题也被引出了。例如:研究者发现,在本节介绍的启发式推理实验中,被试并没有清楚地意识到自己的推理实际上运用着启发式策略,而不是标准的逻辑规则。这说明思维过程并不一定都在意识层面上,也可能包括了相当部分的无意识过程。渐渐地,思维中的无意识过程吸引了研究者的目光。

第三节  思维中的无意识过程

1967年,认知心理学的创始人之一,奈塞尔(Neisser),提出了一个观点——思维的两重性,即“一种思维是有意的、有效的、且有明确目的的;而另一种思维是丰富的、杂乱的和无效率的,能在无意识或不自觉的情况下产生”。在当时,奈塞尔的观点受到大多数心理学家的质疑,因为思维历来被认为是人类意识的凝聚点,无意识的思维听上去像是天方夜谭。

然而近些年来,越来越多的实验证明,思维机能的确可以发生于意识层面以下。即使没有完全意义上的无意识思维,起码思维中的无意识过程也是确实存在的。自然,作为传统上被认为是完全意识过程的思维,要论证其中存在无意识过程,研究者首先必须得提供严密的证明和可靠的判定标准。在论证思维无意识过程的研究中,研究者通常要观察到被试行为表现和言语报告的分离,即被试的行为表示他们通过思考获得了正确答案,比如能够说出答案或进行有效的判别反应;但却“声称”他们不知道思维的过程和正确答案,也就是说,其思维过程低于被试的主观阈限。

丹尼斯(Dienes)和拜瑞(Berry)指出,上述现象也可以描述为被试对自己的思维过程缺乏元认知。于是,丹尼斯、奥尔特曼(Altmann)、夸恩(Kwan)和古德(Goode)总结了两种判定被试缺乏元认知的标准:零相关标准和猜测标准。这些标准分别被研究者用来证明在直觉现象和问题解决中,确实出现了无意识的思维。

一、零相关标准与直觉研究

零相关标准最早是由陈(Chan,1992)提出,指被试的信心和他们的思维任务准确性没有关系。而直觉是指人们在没有意识到证据支持的情况下,依然感到自己的决定、判断、或问题解决办法是正确的情况。如果人们的直觉确实有效,就应该说明这种直觉是有根据的,换言之,是个体思维过程无意识地处理了某些信息所致,即人们在任务准确率上反映出思维过程的存在,却在主观信心上意识不到思维过程,这样就符合了证明思维中无意识过程存在的零相关标准。研究者先后设计了下列实验程序实践以上逻辑:

(一)“两组三项组合”程序

“两组三项组合”(dyads of triads)程序是在远距离联想测验(remote associates test)的基础上设计的。远距离联想测验是由麦德尼克(Mednick,1962)设计的,设计之初的目的是希望能为评价创造力提供工具,而后来却被用于直觉研究。在介绍“两组三项组合”程序前,我们先回顾一下麦德尼克的远距离联想测验。

1.远距离联想测验

麦德尼克认为创造性思维是将相互无关联的观点、想法进行结合的能力。将无关的观点、事物联系起来的方式很多,比如:几个意义无关的词,仅就其音韵相同就能将其联系起来。在日常生活中,也会有此类现象,我们往往会出于记忆单词的需要,而将几个无关的事物进行联系,比如:caricature一词,本意为“滑稽模仿”,为了便于记忆,我们常将其拆成car(汽车)+i(我)+cat(猫),我在汽车和猫中间,很滑稽的样子。需要联系在一起的几个观点间的关系越远,问题就会变得越难,所需要的创造性思维也就越强。不过,并不是将两个无关事物进行联系就被称为创造性思维,为了将创造性思维与思维错乱、妄想、臆想进行区分,麦德尼克进一步指出联系产生的新观点必须是有用的,而不是仅仅具有新颖性。

根据上述界定,麦德尼克(1962)设计了一个实验来测量被试的创造性思维。实验中,向被试呈现一组单词,共3个,且相互间不存在联系,然后要求被试根据这三个单词产生一个联想词,并且这一联想词要和三个单词都有共同点。为了防止被的试联想过于发散,麦德尼克将答案为一个词,当被试反应多个联想词时,则被判为错误反应。以下三个单词为麦德尼克的一例实验材料。

DEMOCRAT(民主主义者)

GIRL(女孩)

FAVOUR(赞同)

上述程序本来是用作创造性思维的测试,但是后来的研究者发现了它在直觉研究和证明无意识思维存在上的价值,在此基础上发展出了“两组三项组合”程序。

2.“两组三项组合”程序

鲍厄斯等(Bowers等,1990)对麦德尼克的远距离联想测验进行了调整,并将其用到直觉研究中。他们的实验被称为“两组三项组合”程序。在这一程序中,向被试呈现两组远距离联想测量的测试项目,每组由三个单词构成,其中一组是可以解决的,也就是说,这三个单词确实有共同的远距离联想词,而另一组远距离联想测试项目是不能解决的,因为不可能找到一个联想词和三者都有关系。以下为鲍厄斯等实验的部分材料:

PLAYING       STILL

CREDIT        PAGES

REPORT        MUSIC

要求被试观察这两组测试项目,并为存在解决方案的一组找到一个合适的共同联想词。呈现测试项目数秒后,不管被试是否找到合适的联想词,都要求其停止思考,并判断哪一组是具有解决方案的。由于被试的思考时间受到严格的控制,所以一般很难在如此短的时间内想到真正合适的联想词,被试的判断基本是基于猜测、预感或直觉的,而此时对于被试判断结果的测量就是对直觉的测量。鲍厄斯等对5个大学本科生进行了实验,结果发现:被试判断的正确率显著高于随机水平,即被试对是否存在合适联想词的直觉较为准确,但是他们并不确信他们的判断。可见,鲍厄斯等的实验满足了零相关标准,被试的正确率和他们的信心没有关系,被试对思维过程或结果缺乏元认知,但仍能猜到答案并进行判断,由此证明了直觉现象中存在内隐的思维过程。事实上,鲍厄斯也认为(1994)被试的判断并不是任意的,而是反映了意识外的信息加工过程。

此外,为了确定直觉现象中的思维无意识性到底受何因素影响,鲍厄斯等对“两组三项组合”测验进行了调整:操纵联想词和三个测试项目间的意义联结。他们将测试项目组分为意义会聚和意义分离两种。前者是指,远距离联想词在和三个测试项目进行联系时,保持同一意思。比如以下的测试项目组:

GOAT

PASS

GREEN

而后者指远距离联想词并不是在和每一个测试项目进行联结时,都有相同的意思,至少与一个测试项目联结时的意义与其它两个联结时不同。比如以下的测试项目组:

STRIKE

SAME

TENNIS

鲍厄斯等的实验结果显示,联想词和三个测试项目联结间的意义会聚程度与被试判断结果存在显著相关。这就和内隐记忆领域的间接启动实验结论相仿,即启动词间的联系显著时,启动效果好,虽然不能意识到启动的存在,但仍表现为反应时的大幅度缩短。在直觉中,被试虽然不知道联想词会是什么,但却会由于意义联结得紧密,而提高判断的正确率。这种特征上的相似,可能说明直觉,和内隐记忆一样,也是内隐认知系统中的一部分,直觉中的确存在无意识思维过程。

此后,鲍厄斯等对“两组三项组合”程序进行扩展,设计了“两组三项组合”程序的两个变式,我们将在下面一一介绍。

(二)滑铁卢格式塔趋合任务

鲍厄斯等希望将“两组三项组合”程序推广到非语词领域。为此,他们设计了“滑铁卢格式塔趋合任务”(Waterloo gestalt closure task)。 “滑铁卢格式塔趋合任务”包含两个测试项目组:一个为能趋合的测试项目组,其中的测试项目为一些熟悉物体的碎片表征,被试能把这些表征整合成一个整体;另一个为不能趋合的测试项目组,其中的测试项目为上述物体碎片的旋转或替换,即无意义的不能整合为一个整体的碎片。和“两组三项组合”程序中一样,给被试数秒钟的时间想出趋合物(碎片整合后的物体)的名字,然后让他们猜测哪一个测试组的物体碎片是可以整合的。实验结果显示:被试直觉的正确率显著高于随机概率。即使当被试的自信评价等级为零时,他们猜测的正确率仍高于随机概率。可见,被试的正确率和信心程度无关,两者符合零相关标准。即:被试对思维过程缺乏元认知,但仍能猜到答案并进行判断,由此提供了直觉现象中存在思维的无意识过程的证据。

但是仍有人对“滑铁卢格式塔趋合任务”提出了质疑:其中的二择一测验误差太高,被试的高正确率可能完全是由于随机误差。对此,鲍厄斯等(1995)进一步调整了“滑铁卢格式塔趋合任务”中被试反应的形式。实验中,他们仍向被试呈现一个可趋合的项目组或相应的不可趋合的项目组,但紧接着要求被试做出的反应并不是判断哪个项目组可以趋合,而是呈现一张表,表上有四个字,让被试指出哪一个字是趋合的正确答案。结果发现,当呈现的可趋合的项目组时,被试反应的正确率高,而呈现的为不可趋合的项目组时,被试反应的正确率相对低。这表明被试的确直觉到了正确答案,某些思维过程确实在被试的意识层面以下发生了。

作为“两组三项组合”程序的变式,“滑铁卢格式塔趋合任务”在非语词任务中满足了零相关标准,这暗示着思维的无意识过程可能是广泛存在于涉及各类材料的各种任务中的。

(三)积累线索任务

鲍厄斯等对“两组三项组合”程序的另一个变式为“累积线索任务”(accumulated clues task)。和远距离联想测验类似,“累积线索任务”中只有一个测试项目组,包括15个单词,它们都具有一个共同的联想词。其中前12个单词与联想词间的距离相对远,而最后3个单词的联想距离则相对近些。以下为“累积线索任务”测试项目组的一个例子:

TIMES

INCH

DEAL

CORNER

PEG

HEAD

FOOT

DANCE

PERSON

TOWN

MATH

FOUR

BLOCK

TABLE

BOX 

实验中,依次向被试呈现这些单词,每次呈现之后,都让被试想出一个单词来作为已有单词列表中所有单词的联想词。随着呈现单词数目的增多,有关正确答案的线索随之增多,被试的联想也越来越趋于准确。在项目依次呈现的过程中,每当被试产生一个联想词后,都要求他们判断这些联想词成为整个问题的最终答案的可能性。结果表明:随着项目依次呈现,被试的联想词越来越接近问题的真正答案,不过他们对可能性的判断却始终维持在一个较低的水平上。可见,被试的正确率在提高的同时,他们却仍不确信自己在向正确答案逼近,这种信心水平和正确率的分离可以作为元认知缺乏和无意识思维的证据。

二、猜测标准与问题解决研究

猜测标准最早由奇斯曼和梅里克尔(1984)提出,指言语报告等外显测试表明被试处于猜测水平,但他们实际的行为水平则高于随机水平,即言语报告等外显测试和操作水平的分离。研究者发现,部分问题解决任务中出现了符合猜测标准的情况,于是进而专门设计特殊的问题解决实验,希望对问题解决中是否存在无意识思维过程作出解答。这些实验方法的例子包括:

(一)FOK范式

FOK(feeling of knowing)就是知道自己能解决问题的感觉。这种感觉属于元认知范畴,可以作为猜测标准中外显测试的指标。事实上,许多研究正是依据被试FOK的评定是否和实际操作水平的分离,来判断问题解决中,被试思维过程的无意识性,这种研究方法后来被称为FOK范式。

经典的FOK范式通常依照以下程序进行:

(1)向被试提出一个难度较大问题,也就是说不是一个能立即回答的问题,例如:著名的传教士和野人过河问题,设有3个传教士和3个野人同在河的左岸,他们都要到对岸去,河里只有一条渡船,他们都会划船,但每次船最多只能乘两人,如果在任何一边河岸上,野人的数量超过了传教士,野人就会吃掉传教士,问怎样才能将传教士和野人从左岸渡到右岸?

(2)在问题解决过程中,如果被试不知道正确答案,则让他们判断自己能否解决问题,找到正确答案的可能性,或是估计自己距离解决方法有多近,即FOK判断;

(3)考察被试所给出答案的正确性程度,并将之与被试的FOK判断进行比较。

研究者(Metcalfe,1986;Metcalfe和Wiebe,1987)用FOK范式对问题解决进行了研究。结果发现:当问题比较困难时,即被试必须要通过顿悟解决问题时,他们的FOK往往和他们答率并不一致,随着被试对接近解决方案评定等级数的上升,他们在问题解决过程中所犯的错误也随之上升;而当被试正在向正确解决方案接近时,他们的FOK评定却一直维持在一个较低的水平上,直到问题被真正解决的那一刻,FOK评定才有了显著的提高。可见,被试的FOK评定和他们实际的正确程度完全背离,这种背离可以被解释为无意识思维过程的证据。

(二)复杂系统控制任务

复杂系统控制任务是一类较为复杂的问题解决任务,要求被试控制若干个输入值,使系统的一个或多个输出值达到某个要求。由于问题过于复杂,被试对系统规则的有意识地探索,也即意识指导下的问题解决尝试,往往得不出什么结果。这样,由于被试在外显测试上的失败,那么他们在问题解决过程中确实发生的行为表现提升,就可以作为思维无意识过程运作的证据。

第八章中讲到的复杂系统控制范式下的实验所用的具体实验材料便是复杂系统控制任务。例如布罗德本特(1977)所设计的城市交通运输系统控制任务。此任务的问题情景十分复杂,被试输入和系统输出间的关系是多对多的关系,不过任务却要求被式在不知道变量间错综复杂的关系的情况下,尽量正确地操纵输入变量以获得合适的输出变量值。布罗德本特假设在这种情况下,被试往往无法通过有意识的思考来获得正确答案,不过他们却能获得一些有关顺利完成任务的内隐知识。实验结果验证了这一假设:尽管被试操纵系统的能力在逐渐改善,但是被试回答选择题的能力却没有改善,这表明虽然被试并不外显地知道变量间复杂的关系,但是他们好象已内隐地习得了这种关系。可见,被试言语报告和操作表现的分离满足了猜测标准,证实了问题解决过程确实要归功于某些无意识过程的存在。另外两个典型的例子是拜瑞和布罗德本特(1984)的糖生产任务(sugar-production task)和人际交互任务(person-interaction task)。正如在第八章中所述,被试在这两个任务中也表现出了操纵系统能力和外显表达的分离,猜测标准的满足再次证实了此类复杂问题解决过程中无意识思维的存在。

(三)球-箱实验

随着研究的深入,研究者在复杂系统控制范式下,对思维的问题解决任务又作了进一步的探讨:诸如,被试操作水平的提高确实是他们进行无意识思维的结果吗?被试在问题解决的过程中,到底哪些阶段是处于无意识水平呢?是策略的无意识还是对答案的无意识,或是整个思维都处于无意识呢?针对这些问题,雷伯和考托夫斯基(Reber和Kotovsky,1997)并设计了“球-箱问题”实验。

1.问题形式

球-箱问题的基本形式是这样的: 

图9-12 球-箱问题示意图

注:球-箱问题的目标是使所有五个球都位于箱子外部。球的移动是通过鼠标对其点击

实现的。只有当箱子打开时,对应的球才可以移进移出。例如在图中所示的状态下,

右边两个球可以移动,而左边三个就不行。当球移动时,某些箱子的开闭状态会

改变。球-箱问题的关键在于通过移动球来打开正确的箱子,最终达成目标。

(采自Reber和Kotovsky,1997)

问题情景中有5个箱子和5个球;每个箱子有两种状态:开或者关;每个球也有两种状态:在箱子里或者在箱子外。图9-12就反映了“球-箱问题”中的某一种可能状态:所有的球都在箱子里,左边3个箱子处于关闭状态,右边2个则处于打开状态。当箱子打开时,球可以移入移出,而球的移动又可能引发某个(些)箱子状态的改变。被试的任务就是把所有的球都挪到箱子外边。

事实上,“球-箱问题”是按照这样的潜藏规则来运作的:(1)最右边的球总是可以移动;(2)除了最右边的球以外,其他球只有当:其右侧紧邻的球处于箱子内,且右侧其他球都处于箱子外时,方可移动。按此规则,整个“球-箱问题”的问题空间是一个包含32个状态的线性空间(即所有状态都是直线排列的,每一个状态通过一步操作只可能转换到相邻的状态),见图9-13。

上面的32个状态分别编号为0-31,数字越大,代表距离目标状态(0号状态)越远。被试必须在问题空间中进行探索,并尝试解决问题。

图9-13 球-箱问题的线性问题空间

(采自Reber和Kotovsky,1997)

2.猜测标准的证实

雷伯和考托夫斯基以球-箱问题为实验材料、80名卡内基梅隆大学的本科生为被试进行了实验。他们的实验采用了分心任务模式,即在实验中,被试除了要解决问题外,还必须进行一个负荷不同的记忆任务。实验中,他们将被试随机分成4组:高记忆负荷组、中记忆负荷组、低记忆负荷组和零记忆负荷组(对照组)。所有被试都从状态21开始解决“球-箱问题”,但不同组被试的次要任务不同,被试在解题的同时听到磁带播放的数字序列,并间或出现“哔”的一声信号音,要求被试一听到信号音:低负荷组被试马上写下信号音前的第一位数字,中负荷组写下信号音前第二位,高负荷组写下第三位,而对照组则写下一个随意想到的数字。问题解决任务完成后所有被试都进行回溯言语报告:“这个谜题是怎么运作的,你有什么建议能帮助其他人解决这个谜题吗?”然后,以上每一组被试又被随机分成2组,分别在零记忆负荷和中等记忆负荷条件下重新解决“球-箱问题”。

实验结果显示:第一次解题的记忆负荷对解题步骤和时间有显著影响,而第二次解题时,记忆负荷对解题步骤和时间没有影响,不过,无论被试在第一次尝试中的记忆负荷是多少,他们在第二次尝试中的成绩总是趋向于某个统一数值,即所有的被试行为水平都明显地改善。此外,所有被试的回溯言语报告内容均按照其揭示“球-箱问题”背后运作规则的程度来评分(1分最差,5分最好)。结果发现,被试言语报告的得分大多在1-2之间,平均分为1.90,不过言语报告分数对第二次问题解决尝试的成绩有预测力。

总之,将所有这些方面结合起来,似乎可见被试虽然在首次问题解决过程中能够外显地获得部分关于问题规则的知识(言语报告和第二次成绩间的相关),但是仅仅局限于一小部分(普遍低下的言语报告分数等),言语报告和行为水平改善的分离符合猜测标准,被试问题解决过程中存在无意识成分。

3.思维策略的内隐性

雷伯和考托夫斯基推断,在问题解决过程中,被试可能会选择三种策略,这三种策略全都可能有效导致“球-箱问题”的解决。其一是规则策略,即被试直接无意识地学习到了问题运作背后的规则。其二称作避免回头策略,即被试在线性的问题空间中随机地挑选一个方向进行探索,并且尽量不撤销以前的移动步骤——这样,被试有50%的几率能够直达目标,另50%的几率则可能是被试走到状态31,但不得不回头并通过整个问题空间到达目标状态。第三种可能策略是运动模式,如果在问题空间中观察每一步骤所移动的球的编号,可以发现从状态31直到目标状态需要进行如下顺序的移动:545 3 545 2 545 3 545 1 545 3 545 2 545 3 545(空格是为了强调模式关系)。如果被试习得了这种操作序列,也同样可以导致有效的问题解决。

在他们进一步的实验中,雷伯和考托夫斯基首先引入了“移动选择”任务,就是向被试随机呈现状态2-29中任何一个单一状态,要求被试对这些呈现的单一状态做出自己的操作判断,在两种可能的步骤中选择一个。结果表明,即使在被试经历两次问题解决尝试后,他们在 “移动选择”任务中选择正确方向的比例仍然处于随机水平。这个结果说明被试使用的不可能是规则策略。

研究者接着改变了“移动选择”任务,允许被试对每一个呈现的单一状态总共进行10步操作;同时他们也改变了回溯言语报告任务,代之以策略再认测验。在策略再认测验中,被试会逐一看到某些陈述,这些陈述可能与三种可能策略中的一种或几种相一致或相抵触,或毫无关系,被试的任务是对每一个陈述在多大程度上准确描述了“正确”的问题解决过程进行判断。实验结果显示:从“移动选择”任务来看,被试是使用避免回头策略来解决问题的。而在策略再认中,被试对他们实际上正在使用的这一策略可以说是一无所知的。因此,最终雷伯和考托夫斯基得出结论认为:被试对自己在问题解决过程中所使用的策略是无意识的。可见,从策略使用层面上来说,仍满足猜测假设。

虽然目前已有较多研究结果都暗示了思维很可能存在无意识的一面;不过,关于思维中无意识过程的研究还很年轻。思维的无意识过程究竟发生在什么阶段、它的机制如何等问题则有待于进一步的研究。

第四节思维和人工智能

思维领域的研究者如何才能确认自己提出的理论解释合乎思维的本质?20世纪50年代,信息加工的观点逐步为心理学家们所接受。这一观点将人脑看成类似于计算机的信息加工系统。于是有研究者自然想到,如果将思维理论的规则在计算机上实现,观察计算机运行和人类被试行为的吻合程度,不就可以检验理论的解释力了吗?这一工作实际上就是试图在机器上模拟、实现类似人类的智慧,这就是人工智能(artificial intelligence)。

一、人工智能的界定

心理学的实验研究往往要经历这样一个历程:对研究对象下操作性定义。操作性定义好处在于:(1)提高实验的可重复性,其他的研究者也可以按照操作性定义操纵研究对象,重复验证实验结论的正确性;(2)提高各个不同研究间的可比性,只有各个研究对研究对象采用一个共同的、可操作的界定,那么这些研究的结论才是可比的。对于研究人工智能——思维的计算机模拟——这一如此复杂的现象来说,操作性定义就尤为必要。

从本章的第二节就可以看出,人类思维的研究内容极其丰富,从概念形成到问题解决,从推理到决策都属于思维研究的范畴,人类思维本身的多角度和复杂性就决定了模拟思维过程的计算机程序的多角度与复杂性,有的研究者从概念形成角度,设计计算机程序,来拟合人类的概念形成曲线;而有的研究者则从问题解决角度,设计计算机程序,来模拟人类问题解决的理性路线。为了使这些模拟研究可被其他领域的实验者重复,为了使各个不同思维研究领域的计算机模拟结果具有可比性,必须要对人工智能下一个操作性定义,即计算机模拟到达何种程度才算是符合了人类思维的特点。所以在具体介绍人工智能的研究成果前,我们首先必须对人工智能进行操作性界定。

(一)图灵测验

图灵测验是由英国数学家图灵(Turing, A. M.)提出的。1950年,图灵在《智力》(Mind)杂志上发表了一篇题为《计算机器与智力》的文章,在文中他首次提出了“模仿比赛”,即图灵测验。图灵测试并不是一项真实的计算机思维模拟测验,而是一个思想实验,它为人工智能下了一个高标准的操作性定义。图灵测验旨在为评估计算机思维模拟过程是否有效提供标准。下面介绍一下图灵测验的主要内容:

模仿比赛必须要有三个参与者,一个男人(A)、一个女人(B)和一个可以是任何性别的询问者(C)。询问者呆在一个远离其余两人的房间里。询问者的比赛目标是确定另两个人中谁是男人和谁是女人。最初,询问者只知道两个人是X和Y,经过一段时间的询问,在比赛结束时,询问者必须判定哪个是男人,哪个是女人,即回答“X是A,Y是B”或者“X是B,Y是A”。在询问阶段,允许询问者提出诸如此类的问题:“X,你能告诉我,你头发的长度吗?”现在假定X是A,那么A必须回答。A的目标是努力让询问者做出错误的辨认,所以他的回答可能是“我的头发是后短侧长的发式,最长的约九英寸。” 

为了防止询问者通过分析A和B的语音特征得到正确答案,A和B不能直接回答问题,他们必须将答案写下来,或者是打印出来。最为理想的就是在两个房间都安装电传打字机,使用电传打字机进行沟通。或者,通过某个中间联系人来传送问题和答案。

B的比赛目标是帮助询问者。她的最好策略是给出真实的答案。她可以附加诸如“我是一个女人,不要听信他的!”之类的信息到她的答案中,但是由于A(男人)也会做出类似的回答,所以询问者可能不会轻易相信她所提供的真实信息。

图灵测验的问题是:当一台机器取代比赛中A的位置时,会发生什么呢?虽然用机器代替人之后,所有的比赛规则和步骤都与上述相同,但是询问者的错误率会有所改变吗?鉴于此,图灵对人工智能下了一个操作定义:如果询问者与计算机分别在两个房间中,并且询问者不能辨认计算机所给出的问题答案和人所给出答案的区别,即询问者无法辨认那只是一台机器,那么此时,我们可以认为计算机很好地模拟了A(男人)的思维过程,在某种程度上,计算机具有了人工智能。

图灵测验对人工智能提出了一个极高的标准:即用人的感觉来判断计算机模拟思维特点的有效性,因此,只有当计算机的模拟和人的思维过程极其匹配时,人才会感觉不出两者间差异的存在。然而,事实上,人的思维过程在很大程度上存在随机性,比如:决策过程中的有限理性,计算机对此类随机过程的模拟具有缺陷,一旦计算机模拟存在一点点差错,图灵测验的操作定义便无法满足,那么是否计算机模拟程序无法从根本上说明人类思维的特点呢?研究者对人工智能的操作定义又作进一步的区分。

(二)强人工智能和弱人工智能

针对上述问题,美国语言哲学家塞尔(Searle,1980)在《心智、脑与程序》一文中将人工智能分为两种——强人工智能和弱人工智能,从强人工智能到弱人工智能的转变降低了人工智能操作性定义的标准。强人工智能,也就是图灵所说的人工智能(strong artificial intelligence),是指直接将人脑看成是一台数字计算机,或是将计算机看成是人脑,计算机和人脑可以在各个方面进行完全匹配,机器可以拥有像人一样的思维过程和智慧,而人的思维则可以解压缩为计算机形式符号与逻辑语言的操纵。

这种定义的高标准主要体现在两个方面:(1)硬件匹配,人的思维过程和计算机模拟的思维具有同样的硬件基础,人脑和计算机的集成电路一样,都是“全或无”的方式进行信息加工的,神经冲动的发放要么就是产生动作电位,要么就是不产生动作电位,决不可能产生一半强度的动作电位,而计算机电流的状态也只有“通”和“不通”两种;(2)软件匹配,人的思维程序和计算机模拟思维程序一样,人的思维具有规则性,可以转换成某种计算机语言,比如:循环、条件和顺序结果的综合,而计算机程序也正是具有高逻辑性的计算机语言的堆砌。只有符合硬件匹配和软件匹配两个要求,计算机思维模拟才算真正意义上的人工智能,而就像我们上面所说的,人的思维过程在很多方面具有随机性,有时并不是按照某一事先设定好的程序进行,人的思维过程和计算机模拟思维过程有时无法进行软件拟合。图灵测验的思维程序设计者们的确可以预先规定,在反复被询问的过程中,计算机应该怎样回答,但是,程序设计者不能预见到询问者可能提问的各种方案和策略。

强人工智能标准对计算机模拟来说过于苛刻,因此,塞尔又提出了另一种人工智能标准,称为弱人工智能(weak artificial intelligence),指用计算机来模拟人类的思维过程,从而检验原有思维理论的确实性。研究者可以通过计算机编程将思维过程的理论模型付诸实施,并将结果与人真实的表现进行比较研究。弱人工智能仅仅把计算机模拟作为一种工具和手段,而并不要求计算机模拟思维与人类的思维在软硬件方面完全匹配。

弱人工智能降低了图灵或强人工智能操作性定义的标准,它基本上依据以下逻辑:虽然计算机模拟思维与人类的思维在软硬件方面并不完全匹配,但计算机模拟思维和人类思维总会有一定的共同点,这些共同点为验证现有的思维理论提供了依据。根据现有的思维理论来编制计算机程序,如果能使计算机以类似于人的方式达到类似于人的思维结果,那么这一思维理论便得到证实,如果模拟不成功,则只能说明计算机模拟思维与人类的真实思维在某些方面还不匹配。以下所要讲述的一些人工智能的成果基本上是基于这一界定。

二、人工智能的成果

基于弱人工智能标准,思维研究者们纷纷将思维理论转换成计算机模型,以便于验证思维理论的正确性。对原先的理论进行有效的验证是人工智能研究的成果。下面是几个具体的实例:

(一)逆向工作与逻辑理论家

人类在问题解决,尤其是复杂问题解决时,通常使用启发法。启发法所凭借的是经验的解题方法,也可称为经验规则,虽然它并不能保证问题一定能得到解决,但却常常有效地解决问题。逆向工作(backward working)和手段-目的分析(means-end analysis)是两种较为常用的启发法。

逆向工作是指在问题解决的过程中,从问题的目标状态往回走,倒退到起始状态。在使用逆向工作启发法时,必须考虑到算子的应用。如果问题空间较小,从起始状态达到目标状态的路径较少,使用逆向工作法解题则较为迅速。例如:已知矩形ABCD,求证:,见图9-14。

图9-14 平行四边形几何题

此题的逆向工作步骤如下:

目标状态:;

算子1:只要证明,就能证明;

算子2:根据边角边定理,只要证明:,,,就能证明;

起始状态:矩形ABCD,已满足上述三个条件。

根据问题解决时的逆向工作策略,纽厄尔、肖和西蒙(Newell,Shaw和Simon,1956)成功地编写了历史上第一个模拟人解决问题的计算机程序。这个程序被称为“逻辑理论家”(logic theorist)。它模拟了人证明诸如上述平行四边形的符号逻辑定理的思维过程,最初仅对怀特黑德(Whitehead, N. A.)所著数学名著《数学原理》第二章的52条定理中的32条成功地做出了证明,后来经过修改,又证明了全部52条定理。

这个成就在学术界迅速引起了巨大的反响,不仅仅是由于“逻辑理论家”是世界上第一个成功的人工智能系统,更主要的是由于它是第一个启发式的人工智能系统。以前的计算机程序已完全可以作到依据算法规则来模拟人的理性逻辑思维,比如:要求计算机根据一系列规则计算复杂的公式,计算机程序完全可以胜任,甚至它能做得比人更好。在这种情况下,持有信息加工观点的思维研究者们将人脑和计算机进行类比,他们认为人和计算机一样也是完全理性的,不承认思维缺乏理性的侧面,即人类在思维过程中决不可能应用启发法。然而,“逻辑理论家”成功模拟了人的有限理性思维,验证启发式策略在人问题解决过程中确实存在,了以前对人类思维完全理性的错误观点。“逻辑理论家”的成功展现了弱人工智能标准验证效用的端倪。

(二)手段-目的分析和通用问题解决者

纽厄尔和西蒙研究发现,手段-目的分析是人类问题解决中的又一项重要的启发式策略。手段-目的分析的核心就是要发现问题当前状态和目标状态的差异,然后找到并应用合适的算子来缩短这个差异,如此进行下去,以接近和达到目标状态。换句话说,就是将问题的目标状态或总目标分为若干子目标,通过实现一系列子目标最终达到总目标,即问题解决。手段-目的分析有两种方式:一是把当前状态转化为目标状态,见图9-15(A);二是寻找消除差异的算子,见图9-15(B)。

图9-15 手段—目的分析的信息流程图

(采自王甦等,1992)

以河内塔问题为例,来具体分析手段-目的分析法在实际问题解决中的应用,总目标是将3个圆盘从1柱移到2柱。这个目标把我们引到第一个流程图。从而发现起始状态与目标状态的一个最重要的差异是圆盘C不在3柱上。于是可以为此建立一个子目标。这样就把我们引到第二个流程图。要消除上述差异,选择的算子是把圆盘C移到3柱。但根据规定,只有当圆盘C上没有其他圆盘时才可移动,现在圆盘C上有圆盘B和圆盘A。因此算子(圆盘C移动)应用的条件与目前状态之间存在差异,所以又出现一个新的子目标,需要回到第二个流程图的起点。消除这个差异需要移动圆盘B,但它之上有圆盘A,要先将圆盘l移开才行,这又是一个子目标,现在,移动圆盘A的条件可得到满足,于是将圆盘A移到3柱,然后即可将圆盘B移到2柱,再将圆盘A移到2柱圆盘B上面,这样就可将圆盘C移到3柱,这时我们又回到第一个流程图,发现当前状态与目标状态的一个最重要差异是圆盘B不在3柱上,而要消除这个差异是另一个子目标,则依照第二个流程图,需先将圆盘A移到1柱,然后方可将圆盘B移到3柱的圆盘C上,剩下的只需将圆盘A移到3柱,至此,完全达到了问题的目标状态或总目标,即按规定将3个圆盘都移到3柱上了。

图9-16 河内塔问题

纽厄尔、肖和西蒙(1958,1959)根据手段-目的分析策略编写了另一个模拟人问题解决的计算机程序,称为“通用问题解决者”(general problem solver)。该程序可成功地用于从定理证明到河内塔和传教士和野人过河问题等多种不同性质的问题。和“逻辑理论家”一样,“通用问题解决者”系统也是一个启发式的人工智能系统,它的成功同样验证了手段-目的分析是人类思维过程的一部分,又一次展示了弱人工智能标准的魅力。

不过,和“逻辑理论家”不同之处在于,“通用问题解决者”包含一个长时记忆库,存储各种有关的知识与使用这些知识的算子,以及一个短时记忆或工作记忆,以串行方式对信息进行各种操作。特别值得指出的是,“通用问题解决者”系统的内部知识是以产生式(production)来表征的。一个产生式由条件(condition)和行动(action)两部分组成,条件即当前的状态和情景。产生式的基本规则是“若条件满足X,则实施行为Y”。“通用问题解决者”系统用一整套的产生式与手段-目标分析中的各个子目标和算子进行对应,用各种产生式来减小当前状态与目标状态的距离。比起传统的计算机模拟所使用的序列规则,产生式系统显得更为灵活,可以根据情景(条件)的变化来调整行为,这种灵活性使计算机模拟的思维过程更加接近人的思维过程,计算机模拟更好地反应了人类思维本身的特点。从这一意义上来说,“通用问题解决者”的成功可谓是计算机模拟史上的一次里程碑。

(三)思维的无意识和策略模拟程序

在上一节中,我们曾提到过猜测标准,即外显测试成绩和行为水平在变化趋势上分离,则可以认为被试对思维过程缺乏元认知,或者说思维具有无意识性。不过有时很难对被试的外显思维过程进行测试,比如:给被试一个较难的问题,并让他们以出声思维来报告其解题的策略,此时,被试外显报告的策略往往是支离破碎的,或者根本不涉及问题的核心,很难评价和确定被试所使用思维策略的正确程度。而此时若根据被试言语报告的策略,用计算机来模拟被试可能的解题过程,然后再对其进行评价实则是较为有效的外显测试指标。将计算机模拟成绩与被试真实的行为水平进行比较则可以验证或证伪思维过程中的无意识。

麦克乔治和伯顿(McGeorge和Burton,19)的研究就是其中一例。他们使用复杂系统控制任务对被试思维的内隐性进行研究。实验时,要求被试在接受糖生产任务训练时给出有关如何选择和控制输入变量值的启发式策略,并将这些启发式策略转化为计算机程序。用计算机来模拟被试的控制行为时,如果在某一特定的情景下,被试所报告的启发式不能确定输入变量值,那么雇佣工人数将会由计算机随机选取。根据被试提供的启发式,由计算机模拟得到的模拟行为可以作为外显测试指标。比较计算机模拟行为和实际被试行为后,发现对于1/3被试而言,启发式所产生的模拟行为和他们的实际行为一样好,有的甚至好于实际控制行为;而另外2/3的表现则符合猜测标准。这表明外显测试和行为水平可能并非完全分离,其中存在个体差异:对于有些被试来说,在解决糖生产问题时,思维过程基本上是无意识的,而对于另一部分被试来说,这一任务的难度似乎并不突出,因而解决问题的过程完全处于意识层面监控之下。

可见,使用计算机模拟来演绎人的外显思维策略,并将之与实际的问题解决行为进行比较,是检验思维内隐性的有效工具。这正是弱人工智能的主要主张——将计算机模拟作为检验理论的工具,而不是力求机器和人的完美匹配,使机器具有和人一样的思维特性。

三、人工智能的局限性

基于弱人工智能的研究获得了许多可喜的成果,然而强人工智能由于其界定上的高标准,很难真正实施。随着人工智能研究的进展,研究者总希望将人工智能的范畴进一步扩大,将研究从弱人工智能领域扩展到强人工智能领域,使机器真正意义上具有人类的思维与智力。当研究者们向着这一目标努力时,他们眼前的障碍也越来越多,人工智能的局限性就像一堵无法逾越的高墙,挡住了研究者前进的道路。这些局限性主要是针对强人工智能的。

(一)反应标准上的局限性

塞尔(1980)提出了一个假想实验,揭示了人工智能在反应标准上的局限性。这一假想实验被称为中文房间。以下为此实验的主要内容:

假设被试是一个不懂中文的人(他的母语不是中文),为了便于讨论,在这里,假设这个被试就是你自己。你坐在一间有两个小孔的屋子里,手上有一本用你的母语编写的指导书(不是中文的),上面明确地告诉你:当从一个小孔递给你一些中文字符(见图9-17)时,你应该做出怎样的反应。然而你根本不认识这些字符,甚至不知道这些字符是中文,在你看来这些字符更像是复杂的曲线,也就是说你完全不知道这些字符的意义。不过,不要担心,指导书里的内容会教你如何操作,使你能够顺利地把递给你的那些中文字符与房间里已有的另一些中文字符相匹配,然后将这些新的字符从另一个小孔送出去。也就是说,整个实验只有三个步骤:首先,将中文字符送入房间;其次,被试按照指导书的内容将输入的中文字符与已有的中文字符进行匹配;最后,被试将新的中文字符送出房间。实际上,中文房间实验模拟了一段计算机程序:输入一段中文字符,经过运算,输出另一段中文字符。

   图9-17 中文字符范例

现在,用计算机来代替中文房间,在房外传入中文符号的人就是计算机的使用者,被试就是计算机的处理器,传入房内的中文符号是问题,传出房间的中文符号是答案,而英文指导则是计算机程序。

在中文房间实验中,你可以根据指导语与房间外面的人用中文进行交谈。如果测试者向你提问:“你懂中文吗?”即使你根本就不懂任何中文,你仍可以回答:“我懂,当然懂。”但是实际上,你的回答只不过是按照详细的指导语进行机械操作的过程,你所做的仅仅是在一项非常简明易懂的模型匹配练习的基础上,依照一定的规则去处理某些符号。实验的结果(很可能)是:房间外面的人相信你是一位通晓汉语的人,虽然实际情况是你对汉语根本一窍不通。

塞尔认为,事实上,计算机和中文房间中的被试一样,虽然表现得好像能进行各种思维,解决各种问题,但是实质上则只是根据一套事先设定好的原则进行类似条件反射似的反应,他们反应的标准是当前刺激与预先存储的某个刺激的匹配程度,而不是真正根据语义或是某一思维策略进行反应。计算机程序中,唯一遵循的原则是计算机语言的合法性,而不是更高级的意义标准,计算机就像中文房间中的被试一样,也许根本不懂问题所描述的内涵。而真正的人类思维过程是智慧的凝聚,反应标准应是高级的意义成分,或是有目的的思维策略,思维的基础是对整个问题内涵与外延的整体把握。计算机思维模拟的反应标准和人思维的反应标准大相径庭。从这层意义上说,计算机反应标准上的局限性使得人工智能无法达到人类的智力水平,无法重复人类的思维过程。

(二)加工方式上的局限性

通常,计算机程序具有线性结构,往往要求执行完一条命令之后,再执行下一条命令,同时执行两条命令则会发生错误。这种对信息的线性处理方式和人的信息加工方式不太一致。虽然信息加工的观点将心理过程看成是一系列连续阶段的信息加工过程,认为信息加工是系列的或是串行的,但仍有许多心理学家对线性加工提出了质疑。艾森克(Eysenck,1984)指出:如里坚持线性加工,那么只能有刺激驱动的加工,即自下而上的加工,而不会有概念驱动的加工,即受到过去经验与知识影响的、自上而下的加工。但实际上,人类思维过程很大程度上受着经验的影响,比如:上述的启发式策略就是根据经验来确定问题解决方向的实例。并且,现在许多心理学家一致认为,人的思维活动既包含概念驱动的过程,也包含经验驱动的过程,这两种加工可能是同时进行的或部分重叠的,比如:在解方程式时,我们既需要根据各步所得的数据来决定下一步该怎么做,也需要以往的经验来指导我们下一步该怎么做,这两种加工往往是结合在一起,同时进行的。这就意味着人类的思维过程中平行加工似乎更多。

用线性加工的计算机程序去模拟并行加工的人类思维过程,一定会存在问题。因为,并行加工往往具有模糊性,同一时刻,思维的结果到底是上行(刺激驱动)还是下行(概念驱动)加工的结果,是不确定的。而计算机的线性加工则必须要排除这些模糊性,因为某一结果一定是由某一条件产生的,执行这条语句后,必定会执行下一条语句。计算机的加工方式了人类思维模拟的精度,这就是计算机加工方式所带来的局限性。

(三)调节系统的缺失

诺曼(1981)认为将人和计算机进行类比,存在根本性的问题:计算机是一个符号系统,而人则有更多的东西,人是生命的有机体,具有生物适应功能,能根据环境的条件来调节自己本身的机能,人还是社会生物,始终和他人、社会发生着互动,并根据他们的反馈来调节自己的行为。诺曼区分了人的三个系统,见图9-18,一个为认知系统,他们认为有生命的和人工的信息加工系统有着共同的结构,这部分可称为纯粹认知系统或认知系统,但有生命系统(比如:人)和人工系统(比如:计算机)不同的是,有生命系统需要根据环境的条件来调节自己的机能,以适应环境的变化,这是通过调节系统(regulation system)来完成的。调节系统是一种内稳态系统,它与认知系统互相作用,以作出对环境的解释和维持内稳态的行动。所以,有生命系统具有目的、愿望和动机,能选择有趣的任务以及与目的相关的作业。诺曼认为认知系统是服务于调节系统的,而情绪系统,处于这两个系统之间,成为它们相互作用的桥梁。他甚至指出:调节系统是处于主导地位的,认知系统是调节系统对智力因素的需要不断增长的结果,只有当认知方面达到一定的质量以后,它才能存在并具有自己的功能和目的。

图9-18 三个系统的作用

(采自Norman,1981)

正因为缺失了调节系统,计算机思维模拟程序往往不能应付多种情景或在多种情景中进行选择。塞尔所提到的由香克(Schank)编制的程序就是一个很好的例证。香克程序的目的是模拟人类理解故事的能力。如,你听到这样一件事情:“一个人走进一家餐馆,要了一份汉堡。当侍者把汉堡端上来时,这个人发现汉堡已经烧焦了。于是,生气地冲出餐馆,既没有付帐,也没有留下小费。”现在如果问你:“那个人吃了那份汉堡没有?”你多半会回答:“没有,那人没吃。”同样地,如果你再听到这样一件事情:“一个人走进一家餐馆,要了一份汉堡。当侍者把汉堡端上来时,这个人非常满意。当他离开餐馆的时候,他不仅付了帐,而且给了侍者小费。”如果这时再问你同样的问题“那个人吃了那份汉堡没有?”你的回答多半是:“是的,他吃了。”这说明:人类的调节系统在判断时,起了主导作用,调节系统使得认知系统在不同的情景下作出了不同的反映,人类的思维正是由于调节系统的作用才具有了灵活性。

现在,让香克的计算机也以同样的方式回答同样的餐馆问题。计算机遇到了困难,由于没有调节系统,计算机只能对所有的情景作出单一的反应,也许香克在设计计算机程序时,就已经设定了一个特定的情景,即一旦买了汉堡,就一定会吃掉,那么此时,不管是“生气”情景,还是“满意”情景,计算机的答案都是“那个人吃了汉堡”。

调节系统使得人类的思维过程极具灵活性,能够根据环境的变化和他们的反馈等多种因素进行调节,对不同的情景作出不同的反应。比如:在上例中,人们的判断会根据买汉堡者的表情,事态发展的状态而改变。而计算机模拟的思维程序由于缺乏调节系统,往往显得呆板,过于严密和合乎逻辑,不能根据事态的变化而对思维过程或思维策略作出有利的调整。可见,人工智能是具有局限性的,计算机的呆板的控制模式使得它很难捕捉人类思维过程中适应性与调节机制。

总地来说,人工智能方面的工作在弱人工智能层次获得了很大的成功,为思维理论的验证提供了有效的工具;但是在试图向强智能方面趋近时,却遇到了障碍,这种障碍可能来源于人类和机器的许多本质性差异。而人工智能在两个层面上所遭遇的截然不同的结果,正促使心理学的理论家和实验者思考变革传统信息加工观点——将人脑类比计算机的观点。限于篇幅和讨论重点,有关认知心理学新取向的内容,请读者自行参考相关资料。

文档

思维的研究方法

第九章思维思维是最高级、最难把握的心理过程之一。人们凭借思维,可以把握那些无法直接感知的事物,理解其中的相互关系,推测其发展,认识其本质。思维的表现形式十分丰富,包括:概念形成、判断、推理、问题解决、决策等,这为思维研究开辟了广阔的天地。早在1911年,桑代克(Thomdike,E.L.)就研究了猫在问题解决过程中的尝试错误学习,而后,格式塔学派的苛勒(Köhler,W.)又研究了猩猩的思维顿悟现象。20世纪50年代起,思维的研究开始涉及深层认知机制方面,如:对问题空间和算子的探讨;对有限理性
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top