斯金納箱(Skinner box)是心理學(xué)實(shí)驗(yàn)裝置。行為主義者斯金納1938年發(fā)明,并于動(dòng)物操作條件作用實(shí)驗(yàn)。其基本結(jié)構(gòu):在箱壁的一邊有一個(gè)可供按壓的杠桿(大多是一塊金屬板),在杠桿旁邊有一個(gè)承受食物的小盒緊靠著箱壁上的小孔,小孔外是食物釋放器,其中貯有顆粒形食物。動(dòng)物在箱內(nèi)按一下杠桿,即有一粒食物從小孔口落入小盒內(nèi),動(dòng)物可取食。一只白鼠禁食24小時(shí)后被放入箱內(nèi),開(kāi)始它在箱內(nèi)探索,偶爾按壓了杠桿,獲得食丸。白鼠開(kāi)始可能并沒(méi)有注意到食物落下,但若干次重復(fù)后,就形成了壓桿取食的條件反射。以后稍有改進(jìn),如外包隔音箱,食物釋放裝置由程序控制等,可測(cè)試動(dòng)物能否學(xué)會(huì)按三次杠桿以得到食物,或間隔一定時(shí)間按壓杠桿才能得到食物。對(duì)不同物種的動(dòng)物,其設(shè)計(jì)稍有不同。該裝置實(shí)際是對(duì)桑代克迷箱的改進(jìn),后被用于研究動(dòng)物學(xué)習(xí)能力和自我刺激與合作行為等心理學(xué)研究。現(xiàn)已采用電子線(xiàn)路,使用更方便。
斯金納(Burrhus Frederic Skinner,1904—1990)是新行為主義心理學(xué)的創(chuàng)始人之一。他1904年3月20日生于美國(guó)賓夕法尼亞州東北部的一個(gè)車(chē)站小鎮(zhèn),在那里他度過(guò)了他的童年和中學(xué)時(shí)代。出于對(duì)文學(xué)的興趣,他進(jìn)入了漢密爾頓學(xué)院,主修英國(guó)文學(xué)。本來(lái)他想成為作家,畢業(yè)后從事寫(xiě)作,但兩年后他便覺(jué)得“沒(méi)有什么重要的事要說(shuō)了”。于是他于1928年考入哈佛大學(xué)讀研究生,改修學(xué)心理學(xué)。1931年他獲得哲學(xué)博士學(xué)位。此后他相繼執(zhí)教于明尼蘇達(dá)大學(xué)和印第安納大學(xué)。1947年他受聘重返哈佛大學(xué),擔(dān)任學(xué)校心理系終身教授。
新行為主義學(xué)習(xí)理論—操作性條件反射
斯金納關(guān)于操作性條件反射作用的實(shí)驗(yàn),是在他設(shè)計(jì)的一種動(dòng)物實(shí)驗(yàn)儀器即著名的斯金納箱中進(jìn)行的。箱內(nèi)放進(jìn)一只白鼠或鴿子,并設(shè)一杠桿或鍵,箱子的構(gòu)造盡可能排除一切外部刺激。動(dòng)物在箱內(nèi)可自由活動(dòng),當(dāng)它壓杠桿或啄鍵時(shí),就會(huì)有一團(tuán)食物掉進(jìn)箱子下方的盤(pán)中,動(dòng)物就能吃到食物。箱外有一裝置記錄動(dòng)物的動(dòng)作。斯金納的實(shí)驗(yàn)與巴甫洛夫的條件反射實(shí)驗(yàn)的不同在于:(1)在斯金納箱中的被試動(dòng)物可自由活動(dòng),而不是被綁在架子上;(2)被試動(dòng)物的反應(yīng)不是由已知的某種刺激物引起的,操作性行為(壓杠桿或啄鍵)是獲得強(qiáng)化刺激(食物)的手段;(3)反應(yīng)不是唾液腺活動(dòng),而是骨骼肌活動(dòng);(4)實(shí)驗(yàn)的目的不是揭示大腦皮層活動(dòng)的規(guī)律,而是為了表明刺激與反應(yīng)的關(guān)系,從而有效地控制有機(jī)體的行為。
操作性條件反射這一概念,是斯金納新行為主義學(xué)習(xí)理論的核心。斯金納把行為分成兩類(lèi):一類(lèi)是應(yīng)答性行為,這是由已知的刺激引起的反應(yīng);另一類(lèi)是操作性行為,是有機(jī)體自身發(fā)出的反應(yīng),與任何已知刺激物無(wú)關(guān)。與這兩類(lèi)行為相應(yīng),斯金納把條件反射也分為兩類(lèi)。與應(yīng)答性行為相應(yīng)的是應(yīng)答性反射,稱(chēng)為S(刺激)型(S型名稱(chēng)來(lái)自英文Stimulation);與操作性行為相應(yīng)的是操作性反射,稱(chēng)為R(反應(yīng))型(R型名稱(chēng)來(lái)自英文Reaction)。S型條件反射是強(qiáng)化與刺激直接關(guān)聯(lián),R型條件反射是強(qiáng)化與反應(yīng)直接關(guān)聯(lián)。斯金納認(rèn)為,人類(lèi)行為主要是由操作性反射構(gòu)成的操作性行為,操作性行為是作用于環(huán)境而產(chǎn)生結(jié)果的行為。在學(xué)習(xí)情境中,操作性行為更有代表性。斯金納很重視R型條件反射,因?yàn)檫@種反射可以塑造新行為,在學(xué)習(xí)過(guò)程中尤為重要。
實(shí)驗(yàn)1:將一只很餓的小白鼠放入一個(gè)有按鈕的箱中,每次按下按鈕,則掉落食物。
結(jié)果:小白鼠自發(fā)學(xué)會(huì)了按按鈕。
這個(gè)實(shí)驗(yàn)比“給狗狗搖鈴喂食”的巴普洛夫?qū)嶒?yàn)更進(jìn)了一步,建立行為。
何為學(xué)習(xí)?就是指將行為與操作者的需求建立相倚性聯(lián)系。換句話(huà)說(shuō),使行為者感覺(jué)到“行為”與“獎(jiǎng)勵(lì)”是有聯(lián)系的。
只要通過(guò)將行為與獎(jiǎng)勵(lì)不斷重復(fù)、建立聯(lián)系,就可以培養(yǎng)起操作者的行為模式。
獎(jiǎng)勵(lì)可以培養(yǎng)行為習(xí)慣,很棒吧?那么看實(shí)驗(yàn)2。
2.行為與懲罰
實(shí)驗(yàn)2:將一只小白鼠放入一個(gè)有按鈕的箱中。每次小白鼠不按下按鈕,則箱子通電。
結(jié)果:小白鼠學(xué)會(huì)了按按鈕。
但遺憾的是,一旦箱子不再通電,小白鼠按按鈕的行為迅速消失。
“懲罰”,作為獎(jiǎng)勵(lì)的邪惡雙生子,可以迅速建立行為模式。然而,懲罰具有一定的副作用:它建立起來(lái)的行為模式,來(lái)得快,去得也快。一旦懲罰消失,則行為模式也會(huì)迅速消失。
從長(zhǎng)遠(yuǎn)來(lái)看,懲罰對(duì)于行為的制止并不會(huì)起到顯著作用。現(xiàn)實(shí)生活中,因?yàn)閼土P帶來(lái)的凡勃倫效應(yīng),有時(shí)甚至?xí)箲土P起反作用。
凡勃倫效應(yīng):美國(guó)學(xué)者凡勃倫認(rèn)為,與產(chǎn)品越降價(jià)、需求越增多的一般規(guī)律不同,特定的產(chǎn)品越漲價(jià),需求越增多。部分上流階層的消費(fèi)目的在于,炫耀自己的社會(huì)地位和成功,滿(mǎn)足虛榮心,所以?xún)r(jià)格越高,需求則增加。相反,如果降價(jià),體現(xiàn)上流階層的界限變得模糊,所以需求減少。
如果想要控制行為者不去進(jìn)行某個(gè)行為時(shí),應(yīng)找到該錯(cuò)誤行為的“獎(jiǎng)勵(lì)物”,移除該獎(jiǎng)勵(lì),從而制止其錯(cuò)誤行為。
然而,即使是獎(jiǎng)勵(lì),當(dāng)不再掉落食物時(shí),小白鼠的學(xué)習(xí)行為也會(huì)逐漸消失(雖然消失得稍慢一些)。而且這樣太浪費(fèi)食物了!那該怎么辦呢?
接下來(lái)是實(shí)驗(yàn)3。
3.固定時(shí)間獎(jiǎng)勵(lì)
實(shí)驗(yàn)3:將一只很餓的小白鼠放入斯金納箱中,由一開(kāi)始的一直掉落食物,逐漸降低到每1分鐘后,按下按鈕可概率掉落食物。
結(jié)果:小白鼠一開(kāi)始不停按鈕。過(guò)一段時(shí)間之后,小白鼠學(xué)會(huì)了間隔1分鐘按一次按鈕。
當(dāng)?shù)袈涫澄锿V箷r(shí),小白鼠的行為消失。
嘖嘖,失敗了。沒(méi)有培養(yǎng)起小白鼠連續(xù)按按鈕的行為,反而使小白鼠“偷懶”了。為什么?因?yàn)樾袨檎咧蓝唐趦?nèi)行為不會(huì)再得到獎(jiǎng)勵(lì)?!冒?。最關(guān)鍵的實(shí)驗(yàn)4。
4.概率型獎(jiǎng)勵(lì)
實(shí)驗(yàn)4:將一只很餓的小白鼠放入斯金納箱中,多次按下按鈕,概率掉落食物。
結(jié)果:小白鼠學(xué)會(huì)了不停按鈕。
當(dāng)不再掉落食物時(shí),小白鼠的學(xué)習(xí)行為消失速度非常慢。
隨著概率越來(lái)越低,小白鼠按按鈕的學(xué)習(xí)行為沒(méi)有變化,直至40-60次按按鈕掉落一個(gè)食物,小白鼠仍然會(huì)不停按按鈕,持續(xù)很久一段時(shí)間。
(同樣的,用鴿子做實(shí)驗(yàn),平均每5分鐘獲得變化時(shí)距的食物強(qiáng)化的鴿子,每秒能做出2-3次反應(yīng),連續(xù)反應(yīng)長(zhǎng)達(dá)15小時(shí))
這個(gè)實(shí)驗(yàn)?zāi)M了為什么“賭博”——如簡(jiǎn)單的老虎機(jī),或者更復(fù)雜的賭博——會(huì)給予人類(lèi)以依賴(lài)感,或者說(shuō),成癮性。
由于概率性給予結(jié)果,行為者很難直觀(guān)地判斷機(jī)制是否失效,所以單次的失敗不會(huì)給予明顯的“懲罰”效果,終止行為者的習(xí)慣,從而行為者的學(xué)習(xí)行為會(huì)一直持續(xù)下去。
然后是一個(gè)有趣的實(shí)驗(yàn)5。
5.迷信的小白鼠?
實(shí)驗(yàn)5:好吧,其實(shí)實(shí)驗(yàn)5還是實(shí)驗(yàn)4,概率型斯金納箱。
結(jié)果:這些小白鼠有很多培養(yǎng)出了奇特的行為習(xí)慣,比如撞箱子、比如作揖、比如轉(zhuǎn)圈跳舞。
這是因?yàn)榈袈涫澄锴?,小白鼠正好在進(jìn)行這些行為,于是產(chǎn)生了“迷信”。
許多游戲中傳出的謠言,比如“在中午抽獎(jiǎng)容易得到大獎(jiǎng)”,或者“帶滿(mǎn)一背包幸運(yùn)兔腳可以獲得更好的裝備”之類(lèi),其原理與之相同。
斯金納通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),動(dòng)物的學(xué)習(xí)行為是隨著一個(gè)起強(qiáng)化作用的刺激而發(fā)生的。斯金納把動(dòng)物的學(xué)習(xí)行為推而廣之到人類(lèi)的學(xué)習(xí)行為上,他認(rèn)為雖然人類(lèi)學(xué)習(xí)行為的性質(zhì)比動(dòng)物復(fù)雜得多,但也要通過(guò)操作性條件反射。操作性條件反射的特點(diǎn)是:強(qiáng)化刺激既不與反應(yīng)同時(shí)發(fā)生,也不先于反應(yīng),而是隨著反應(yīng)發(fā)生。有機(jī)體必須先作出所希望的反應(yīng),然后得到“報(bào)酬”,即強(qiáng)化刺激,使這種反應(yīng)得到強(qiáng)化。學(xué)習(xí)的本質(zhì)不是刺激的替代,而是反應(yīng)的改變。斯金納認(rèn)為,人的一切行為幾乎都是操作性強(qiáng)化的結(jié)果,人們有可能通過(guò)強(qiáng)化作用的影響去改變別人的反應(yīng)。在教學(xué)方面教師充當(dāng)學(xué)生行為的設(shè)計(jì)師和建筑師,把學(xué)習(xí)目標(biāo)分解成很多小任務(wù)并且一個(gè)一個(gè)地予以強(qiáng)化,學(xué)生通過(guò)操作性條件反射逐步完成學(xué)習(xí)任務(wù)。