《別斃了那隻狗》

下载本书

添加书签

別斃了那隻狗- 第5部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!

为了使学成的行为维持一定的可靠程度,非但没有必要每次都增强这个行为,而且极为重要的是,不可以经常增强这个行为,而要改为偶尔增强,而且是随机性(无法预测)的增强。

心理学家称这种增强方式为「变化性增强时制」(variable schedule of reinforcement),它维持行为的效果比起持续性、可预测的增强方式更好。一位心理学家曾跟我这么解释:假设你的新车总是很容易岭动,某天当你坐上车后把车钥匙一转,它却没发动,你可能会再试着发动几次,但是你很快就会判断这辆车出了问题而打电话给修车厂,由于转动车钥匙的行为没有立即带来期待的增强结果,这个转动钥匙岭动车子的行为很快便会消失。相反地,如果这是台老旧的破车,几乎很少在第一次就发动,而且通常还得花很久时间发动,这时候你便可能花上半个小时不断试图启动,因为这个转动车钥匙的行为长期以来一直受到变化性增强,因而能稳定维持着这个行为。

如果海豚每次跳跃都一定有鱼吃,牠跳跃的动作将很快变得马虎敷衍,过得去就好,然后要是不给鱼了,海豚跳跃的动作很快就会消失。不过,如果在牠学会跳跃就有鱼吃的概念后,我现在开始只增强第一次跳跃、第三次跳跃,接着便随机增强牠的跳跃动作,这个行为就会稳定维持下来,当动物没获得奖励时,牠们反而会更常跳跃,期盼下次中奖的机会,而且跳跃时甚至可能变得更有活力。如此一来,我便能够选择增强较具活力的跳跃动作。

利用变化性增强时制可以塑造出较佳的表现。不过即使是专业动物训练师,有些人仍法善用变化时制的正增强方法,它对许多人似乎都是个特别难以理解与接受的概念,我们都知道当错误行为停止时,我们就不必再继续处罚,可是我们往往无法理解为何没有必要继续奖励好的行为或甚至不应该这么做。这其实是因为我们想以正增强训练出进退有礼的良好行为时,我们自己也不太确定应该怎么做。

变化性增强时制的威力正是赌博的本质,要是每次投一块硬币到吃角子老虎里就会有十块硬币掉出来,你很快就会丧失兴趣,虽然你的钱会越来越多,但是这种方式实在很无趣。人们之所以爱玩吃角子老虎正是因为他们无法预料将出现什么:可能空空如也、可能掉下一些钱、也可能掉下很多钱。我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性增强的作用就是让他们上瘾的原因。

变化性增强出现的时间间隔越长,它所维持行为的效果就越强,不过如果你想设法消除某项行为,把时间间隔拉长的变化性增强就对你很不利。所有未获增强的行为都有自行消失的倾向,但是如果它不时获得增挂,尽管只是偶发事件  抽根烟、喝杯酒或者对不断唠叨或哀求的人梢事让步  这个行为不仅不会消失,事实上它可能反而被这种间隔拉长的变化性增强时制维持得更好,这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。

我们都看过一些遭配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人却执迷不侮的情况,传统以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其它方式离开恶劣的另一半,他们旋及又会找到同类型的对象重蹈覆辙。

这些长期成为受害者的人是否具有严重的心理问题呢?有这个可能,不过他们也可能是长间隔变化性增强时制的受害者。常你刚开始与对方交往时,认为对方迷人、性感、风趣你的钱会越来越多,但是这种方式实在很无趣又无微不至,即使这个人日后逐渐变得难以相处,甚至施暴,但偶尔还是会对你展现好的一面,即使获得这些美好增强物的时光变得越来越罕见,它却成了你的人生寄托。从常理来看,这似乎是十分反常的现象,但是从训练观点的角度看来却显而易见:这些美好时光出现得越少、越无可预测,它的增强作用越强大,而且你的基本行为也将越为持久。此外,也不难理解为什么曾经有过这类关系的人会再度寻求同类对象,因为他们与和善正派的正常人交往时可能就是少了那种增强物极少出现、令人渴盼、因而增强效果加倍所带来的快感。

从操纵者的角度来看,想任意使唤某个人、并且让他随时言听计从,只要偶尔给他他想要的东西就可以达到目的了,这便是皮条客管理手下妓女的手法之一。它的确是个极为有效的方法,但是一旦受害者理解到操纵者的强烈「魅力」至少有部分来自这种变化性增强时制,他们通常便能冷静离开这种关系,找寻不同的对象。

不适用变化性增强的情况 (p。59)

(Exceptions。to。Variable。Reinforcement。–。p。23)。

在行为学成后不应该采用变化性增强的情况只有一种,那就是当这个行为牵涉到解答问题的时候。高级服从训练要求狗儿从一堆杂七杂八的东西里找出主人摸过且带有气味的对象,每当狗儿选对对象时都必须让牠知道,这样牠才知道下次该怎么做。进行分辨测验(例如找出两个声音之频率较高者)时,动物每次答对都必须获得增强,这样牠才能一直获知要求牠回答的问题是什么(当然,这时可以使用制约增强物)。我们在玩填字游戏或拼图时,每次猜对就会被增强,因为只有正确的字或拼图片才能放入对应的空格或位置里,如果每个空洞都可放入多片拼图,你便得不到因正确选择带来的正增强,这种回锁对于多数选择性测验的情境都是必要的。

如何打破「起头最难的障碍」 (p。60)

(Long〥uration。Behaviours。–。p。24)。

除了变化性增强时制之外,我们也可以采用「固定增强时制」(fixed schedules of reinforcements),这意谓动物必须在预定时间内持续某项行为,或者必须完成预定次数的行为之后才会获得增强。举例来说,我可以安排海豚连续跳跃,每跳完六次就增强一次,于是连跳六次的行为很快就会经常出现。但固定增强时制的问题是,连续行为当中较早出现的行为永远得不到增强,于是常会变得越来越马虎,过得去就好。以海豚跳跃为例,除了最后一次实际获得增强的跳跃动作以外,其它跳跃动作将逐渐变得越来越小。固定增强时制的缩减效应或许是影响人类许多任务的一项因素,以工厂装配线为例,人们通常必须工作一段固定时间才能获得增强,与工作表现优劣无关,人们当然只想尽量少花力气,只要足以让他们待下来就好,而且每次刚开始工作时的表现可能会特别糟。以海豚来说,偶尔随机增强第一次或第二次跳跃对于维持行为的效果与增强第六次跳跃一样有帮助。对人类来说,如果各式奖励津贴或其它形式增强物(例如颁奖)与工作量或工作表现有直接关系,并且不与平常的增强物同时出现,它的增强效果将会很好。

无论采取固定或变化性增强时制,都可以训练出一长串的连续行为,小鸡可以为了一粒玉米猛啄钮扣一百次以上,人类也有许多久候增强的例子,有位心理学家开玩笑地说,自人类存在以来,等待时问最久、一直未获增强的行为就是念研究所。

间隔极长的增强时制有时会因为超过极限而失效,小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能量高于一粒玉米提供的能量时,啄东西的行为通常会消失,因为做这件事所获得的好处太少,变得不值得做。这种情形当然也常岭生在人类身上。

间隔极长的增强时制也可能产生另一个现象,小鸡一旦开始啄东西以后即会毫不间断地持续啄,因为每啄一次将更接近获得增强的机会,不过研究人员注意到,增强间隔拖得越长,小鸡开始啄东西的行为就会越晚出现,这种情形称为「长时间行为的延迟启始现象」(delayed start of longduration behavior),这是每个人在日常生活中都非常熟悉的现象。

遇到任何耗时很长的工作时,无论是报所得税或整理车库,每个人都想得出许多无法立即开始进行的理由。写作(有时甚至只是写封信)是个花时问的行为,虽然一旦开始写了之后通常会进行顺利,但是要叫人坐下来开始写真的很难! 作家詹姆斯·索伯 (James Thurber)发现,要他开始着手写稿真的非常困难,他有时会装装样子骗他老婆(可理解地,她当然急着要他写稿,因为这样才能付房租),他会整个早上躺在书房沙发上用一只手看书,同时用另一只手随便敲着打字机键盘,将来可以获得金钱正增强物的愿景不敌这个延迟启始的现象,而假装打字的动作至少阻止了被老婆斥责的负增强物。

要克服这种延迟启始的现象有一个方法:在行为刚开始时即给予一些增强物。我有时会在海豚连续跳跃六次的动作中增强第一次或第二次的跳跃动作,我也会用同样的技巧训练自己。多年来,我曾经每星期有一两个晚上要上研究所的课,三小时的课再加上地铁各一小时的来回,每次都花上很久的时问,每当接近下午五点钟我总是出现不想去上课的强烈欲望。不过后来我发现,假如我把这趟路程分段,再把第一段分成五个小步骤  走路到地下铁、赶上列车、转车、搭公交车去大学和最后爬上楼梯去教室,而且每当在我完成一个小步骤就犒赏自己一小块我很喜欢但平常不吃的巧克力,这个增强每个初期小步骤的作汰至少让我能够走出家门,而且几星期之后我已经能够一路前去上课,不再需要巧克力,心中也没有挣扎。

迷信行为:意外的增强效果 (p。62)

(Superstitious。Behaviour:。Accidental。Reinforcement。–。p。26)。

现实生活中无时无刻都会出现增强,而通常都是碰巧发生的。一位研究者鹰的生物学家注意到,如果老鹰在某处树丛下抓到老鼠,随后约有一星期的时间牠每天都会到该处侦察,牠飞经那个特定地点的机率已经被强烈增强。如果你在垃圾桶里找到一张二十美元的大钞,我相信你隔天再次经过这个垃圾桶时,肯定会仔细往里头瞧瞧。

那个意外的增强对老鹰有利,事实上,动物行为可说是为了使每个物种从增强上获利而演化出来,然而关连性也会意外产生,而且它仍可能对行为有深切影响。如果某项行为与后果其实毫不相干,但动物仍出现该行为,彷佛牠必须这么做才能获得增强,科学家称此行为为「迷信行为」。就举咬铅笔的例子好了,如果考试时把铅笔放到嘴里,正好在此时想到了正确答案或好灵感,于是咬铅笔的行为即受到了增强。我上大学时每枝铅笔都盖满了齿痕! 遇到特别难的考试时,我有时还会把铅笔咬断。咬铅笔有助于思考吗?当然没有,这只是个被意外制约的行为罢了。

人们出任要务时会穿上特定衣物或进行某套仪式也是出于同理。我看过一名棒球投手每次准备投球前都会进行一套九个步骤的连锁动作:轻碰棒球帽、把球轻触手套、把棒球帽往前推、擦擦耳朵、把棒球帽往后推、单脚来回磨地等等,局势紧张时他可能还会把整套动作重复两遍,而且从来不会变动动作顺序。这套动作发生的时间相当短(球赛播报员从不曾提及这些动作),然而它却是一套极为繁复的迷信行为。

动物接受训练时也常会蹦出迷信行为,牠可能会出现一些你并未特意要求的反应,但这些反应常被意外增强而受到制约,例如,动物可能出现牠似乎必须待在某处、面朝特定方向或出现特定坐姿时才能获得增强的样子,当你要牠换地方训练或面朝另一个方向时,牠的行为却难以理解地突然做不好了,想找出原因可能得花些功夫,因此聪明的作法是,在行为至少完成了部分训练之后,随即在进行训练时变化所有你不认为重要的情境变量,以免发展出一些日后可能成为阻碍的意外制约行为。

最重要的是,要注意不经意时形成的增强间隔模式。动物和人类对时间的间隔都很敏锐。有一次,我十分确信自己已训练两只鼠海豚依讯号跳跃(看我的手势),直到一位来访的科学家拿着秒表告诉我,只要每隔二十九秒牠们就会跳跃一次;果真没错,无论我是否给讯号,牠们都会每二十九秒跳一次,我给讯号的行为意外被制约得极为规律,而鼠海豚是因为发觉了这个规律性而跳跃,并非依照我所给予的讯息而动作。

许多传统动物训练师的想拭及行为也都充斥着迷信,他们有些人告诉我,海豚较喜欢穿白色衣服的人
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架