激勵強化理論

激勵強化理論

激勵強化理論指對強化的作用機理、強化物的分類與組合、強化的過程分析以及強化的操作技術性設計等,形成了系統的學說。其中的正強化優先觀點,在現實管理中得到廣泛套用。用強化理論塑造新型人類社會的構想,不僅在學界,而且在民眾中產生了巨大的反響,其社會影響遠遠超出了學術範圍。激勵強化理論由美國心理學家斯金納創建。

簡介

管理學的研究領域中,斯金納的強化理論獨樹一幟。作為美國最傑出的心理學家之一,斯金納在把科學方法引入心理學上具有里程碑式的地位。他根據自己的實驗,創造性地發展了巴甫洛夫的條件反射學說和華生的行為主義學說,提出了以操作性條件反射為基礎的強化理論。對於管理學來說,強化理論是對激勵

強化理論的大師斯金納強化理論的大師斯金納
機制進行科學分析的理論平台。尤為重要的是,斯金納通過大量實驗,對強化的作用機理、強化物的分類與組合、強化的過程分析以及強化的操作技術性設計等,形成了系統的學說。其中的正強化優先觀點,在現實管理中得到廣泛套用。他發明的“斯金納箱”,至今仍是進行心理學研究的標誌性工具。斯金納志在改造社會,他關於用強化理論塑造新型人類社會的構想,不僅在學界,而且在民眾中產生了巨大的反響,其社會影響遠遠超出了學術範圍。斯金納近乎極端的科學化追求,試圖用科學改造人文的思想方法,使他的理論成為學界爭議的焦點。而正是這種爭議,為包括管理學在內的社會科學發展提供了必要的張力,也為斯金納奠定了大師級的聲望。 激勵在管理中的作用人人皆知,但是如何使激勵有效,卻使許多富有經驗的經理也撓頭。從經濟學的邏輯看,激勵能否有效至少取決於以下前提:第一,激勵所提供的東西是激勵接受者所需要的東西,並且能引起激勵接受者的獲得欲望;第二,激勵所提供的東西必須具有稀缺性和排他性,也就是說要使接受者獲得某種獨享;第三,激勵效用是曲線而不是直線,收益和付出的關係有增有減,相關度有大有小有正有負,要合理運用,既不能“過”,也不能“不及”。在這些前提下,管理學家們提出過很多激勵理論和模型,其中斯金納提出的“強化理論”至今仍然具有重大的理論和實踐意義。

強化理論的激勵原理

斯金納認為,激勵涉及到以下兩種反射過程:S(刺激)→R(反應)和R(反應)→S(刺激)。從而補充和豐富了此前心理學家提出的行為反應模式。 所有的行為主義者都注重刺激與反應的關係。在斯金納之前,人們一般看到的是“刺激→反應”模式,也就是關注那些引發行為的刺激。這種刺激能使行為者產生反應,所以具有激勵作用。但這種激勵不一定有效。因為這種模式是先有刺激,後有行為,行為者得到刺激不見得會產生相應行為。“有錢能使鬼推磨”,而拿了錢的鬼不見得會去推磨。這種模式下,刺激對其後的行為無法形成有效的制約,而且具有被動性。所以,在現實中依據這種模式進行的激勵,往往不盡人意。很多管理者都會遇到這種困境。例如,不發獎金不幹活,但發了獎金不見得就有積極性;沒錢的時候覺得有了錢就一切好辦,有了錢才發現錢也不是萬能的。 鑒於上述激勵模式的缺陷,斯金納提出了“反應→刺激”模式,也就是關注行為結果給行為者帶來的刺激,由此而形成了他的強化理論,這正是斯金納對管理學貢獻最大的地方。按照這一模式,激勵不能局限於行為前的刺激,更重要的是取決於行為後的結果。換句話說,激勵來自於行為後果的強化。某種行為出現後,如果會帶來具有強化這種行為的後果,反覆持續,就能使行為與強化之間形成很強的相倚關係,這樣,管理者就可以通過強化來調節這種行為。管理者可以調節強化物的種類、頻率、強度,但歸根到底,激勵作用是由被管理者的自身行為產生的,從而使強化對後續行為形成有效制約,而且具有主動性。例如,能不能拿到獎金,不是由頭兒說了算,而是由自己的行為決定的。管理者的作用,不在於直接給被管理者提供刺激,而在於調整行為與強化物之間的相倚關係。 斯金納認為,即使對“反應→刺激”模式而言,也需要區分外部環境的強化和行為本身的強化。一般來說,在行為發生後的強化有兩種:一種是強化的內在相倚性;另一種是強化的外在相倚性。所謂強化的內在相倚性,是指行為本身的結果所產生的強化效應;所謂強化的外在相倚性,是指行為發生後來自外部的強化效應。比如,一個研發人員,他的某種新發現會使自己沉浸於這種發現之中,甚至為之探根究底而廢寢忘食,這裡表現出的是內在相倚性。而這種研發人員的行為,也會得到上司的表揚或者同事的讚許,沒有這種行為就得不到相應的表揚和讚許,這裡表現出的是外在相倚性。在管理活動中,這兩種相倚性所形成的激勵都應該予以重視。 斯金納之前的激勵,往往著眼於對激勵對象提供刺激物,甚至會對刺激物的大小多少斤斤計較,但是,卻不太重視刺激物與激勵對象行為後果的關聯。這樣,很容易使激勵失效,或者使激勵的作用扭曲。這種所謂激勵,不能有效地建立強化的外在相倚性,更談不上形成強化的內在相倚性。所謂外在相倚性,強調的不是刺激物本身,而是刺激物與行為後果的聯繫。如果外在刺激與行為後果沒有關聯或關聯度不大,那么,這種外在刺激就不能促成有效的後續行為。例如,人們往往重視報酬的高低,但如果報酬與當事人的努力沒有多少關聯,不論報酬的高與低,都無法起到激勵作用。在這種情況下的高報酬,會使當事人對付酬者形成感恩心理或依賴心理,但不能調動積極性。更常見的情況是,管理者由於激勵措施不當,會建立起錯誤的外在相倚性。例如,以完成定額作為付酬依據,這樣,完成定額與得到報酬的外在相倚性建立了,然而這種相倚性卻割斷了工作質量與報酬的聯繫,員工的後續行為就很有可能只管數量不管質量。再進一步,如果把質量與報酬也關聯起來,這樣,外在相倚性不再發生偏差,但是假設沒有內在相倚性,員工依然有可能僅僅追求表面的質量而忽視內在的質量。所以,還需要有員工自己對質量的認可程度和追求力度,形成內在相倚性。外在的讚許和期盼的目光,都會對內在相倚性的形成起到或大或小的作用。管理者最需要警惕的是,本意是為了建立符合管理者意圖的外在相倚性,但採取的刺激手段卻破壞了或妨礙了與其匹配的內在相倚性。在現實中,有些管理者採取的刺激手段,往往會鼓勵弄虛作假、矇混過關,就同這種相倚性的不匹配現象有關。

強化物及其分類

強化作用離不開強化物。所謂強化物(reinforcer)不一定是實物,也可以是行為、表情等等。只要在某種行為之後,這種行為本身或者由它帶來的後果可以刺激該行為的再次出現,就屬於強化物。強化物在塑造人們的行為上有著極大作用。 一般來說,強化有兩種:正強化和負強化。通過某種強化物,能使管理者期望的行為發生機率增大,行為者受到這種強化物的激勵,其積極性會得到提高,這就是正強化。反過來,通過某種強化物,能使管理者期望的行為發生機率減小,行為者受到這種強化物的激勵,其積極性會消退甚至喪失,這就是負強化。由此出發,斯金納把強化物分為兩種:正強化物(positive reinforcers)和負強化物(negative reinforcers)。 對正強化物的效用可以從兩個層面來理解。一個層面是某一行為如果會帶來行為者的愉快和滿足,如給予食物、金錢、讚譽和關愛等,行為者就會傾向於重複該行為;另一個層面是某一行為如果能減少和消除行為者的不快和厭惡,如減少噪聲、嚴寒、酷熱、電擊和責罵等,行為者也會傾向於重複該行為。 與此類似,對負強化物的效用照樣可以從兩個層面來理解。懲罰性強化物和消退性強化物。懲罰性強化物是指會給行為者帶來不快的東西,能使行為者的行為傾向減弱;消退性強化物是指減少或取消令行為者愉快的東西,也能使行為者傾向於終止或避免重複該行為。 對正強化物與負強化物的區分,不能想當然,而要以其效果確定。比如,限制一個孩子獲得某種玩具的欲望,其效果很可能是極大地激發了這個孩子獲得這種玩具的行為。現實中某些東西,越禁止反而越流行,實際上這種禁止就起著正強化作用。而不恰當地對某種行為進行言過其實的讚揚,很有可能引起反感而削弱這種行為,讚揚起的是負強化作用。有時候官方樹立的先進模範反而收不到正面效果,就是這種機制。一個部下過於明顯地逢迎上司,有可能會引起這個上司的反感。這些,都是值得激勵研究注意的。更有意思的是,有些表面上截然相反的強化物,其強化作用卻高度一致。如果對賭博進行強化分析,就不難發現,不論是輸是贏,都會起到強烈的正強化作用。贏了,會刺激賭徒繼續;輸了,還會刺激賭徒繼續。所以,單靠賭博本身的輸贏,很難消退賭博行為。公司經營中,有些人偏愛投機方式,其中一個重要因素,就是因為投機方式不論後果是成功還是失敗,都會產生類似賭博的正強化效應。 從強化物效用的大小和重要程度來講,還可以進一步將強化物劃分為初級強化物和條件強化物。初級強化物對有機體來說,往往是無條件的,它能滿足人和動物的基本生理需要,如食物、水、安全、溫暖、性等。條件強化物需要通過初級強化物才能產生作用。任何一個中性刺激物,如果與初級強化物反覆聯合,它就能使自身獲得強化物性質。它是初級強化物的附屬品。例如金錢,對小孩它不是強化物,但當小孩知道錢能換糖時,它就能對兒童的行為產生強化效果。在這個例子中,糖果就是初級強化物,而金錢則是條件強化物,金錢的強化作用是由於與糖果的結合才獲得的。作為管理者應該注意,初級強化物是最基本的,然而條件強化物是最常用的。二者的匹配和結合方式值得進行深入探討。 還有一種特殊情況,強化物與行為之間的關係是非理性的,斯金納把這種強化行為稱為“迷信”(superstition),也稱為“非相倚強化”。在斯金納的實驗中,假如把給白鼠餵食的方式改為不是按壓槓桿引發,而是每隔15秒固定送食一次,那么,白鼠在首次餵食之前的偶然動作就會形成“迷信”。如果白鼠正在作揖,它就會在此後不斷作揖以求得食物;如果白鼠正在嗅通氣孔,它則會不斷嗅通氣孔以求得食物。人類這種情況也十分多見,比如,天旱引發的祈雨行為,某個運動員對某種動作、某種服飾與獲勝之間的看法以及由此而採取的行為等等,都屬於迷信。迷信只有在多次無效的情形下,才會逐漸產生操作性消退。但是,只要有偶然性存在,迷信就不能徹底根除。 要使正負強化能達到各自預期的效果,對強化物的恰當選擇是很重要的。一般而言,在使用強化理論之前,首先要弄清是要對行為進行正強化還是進行負強化,然後針對行為者的特點選擇恰當的強化物。在選擇時,並不是強化物的數量越多越好。斯金納認為,由於強化物的數量與對行為的強化效果不一定成正比例,真正的強化物也可能被誤用,因此,合理安排強化措施,比單一追求強化物數量更為重要。這裡實際上涉及到了強化物的合理配置問題。為此,斯金納設計了“強化表”,對強化物合理安排做出了有益嘗試。對於現實中的管理者來說,更為重要的不是照搬斯金納的強化表,而是參照和借鑑斯金納的思路,根據自己所處的實際情況,尤其是考慮各種特定的環境因素,對強化物的選擇、搭配和使用作出符合理性的科學安排。 此外,強化物效用的大小還與其接受者有關。一種強化能否起到應有的作用,取決於強化物運用是否恰當,而強化物運用是否恰當,又取決於強化物的作用對象接受與否。因此,在選擇強化物時必須考慮到行為者的自身特徵。比如,提升職務一般能夠起到正強化作用,但是,在霍桑實驗中曾經發現,某個女工拒絕了上級提升其職務的安排。理由很簡單,在這個女工看來,提升職務有可能會破壞她同工友們之間良好的人際關係。對於這個女工而言,工友之間的人際關係,遠遠要比職務提拔更重要。所以,在多數人身上能起到強化作用的提拔方式,對於這個女工卻不是合適的強化物。當然,這個女工對強化物的認知,並不是心血來潮的怪癖,而是環境因素的綜合作用在她身上的反應。所以,管理中採用強化措施時,要以對員工狀況的科學分析為前提。

強化物的組合運用

一般而言,強化物的選擇至少要考慮到三個方面的因素:第一,是管理者所能提供的強化物;第二,該強化物是管理對象所能接受的;第三,該強化物能夠起到應有的強化效果。從這三個方面來考慮強化物的選擇,或許能找到很多有效的強化物。但人類需求的複雜性和多樣性,往往需要更大範圍的強化物來進行激勵。現實中的強化物,會受到資源稀缺性的限制以及使用成本的限制。在這種情況下,可以通過強化物的恰當組合來擴大選擇範圍。對於管理者來說,弄清這種組合十分重要,因為在最常見的強化物中,金錢總是有限的,即便是有權印發鈔票的政府,濫發鈔票也會貶值;提拔總是有數的,人人都提拔為經理,名片上的經理就會變成事實上的業務員;一種物品一旦不再稀缺,強化作用就會迅速消失,哪怕是不花成本的微笑,用多了笑臉也會失去激勵效應。 強化物的組合有兩種方式:一是把本來就有強化作用的不同事物結合使用,只要恰當配置,可以產生出具有很大效力的強化物;二是把原本沒有強化作用的事物按照行為關係結合使用,使它產生強化作用,這就是條件性強化物。條件性強化物的具體做法是,把一個中性刺激物與一個強化刺激物反覆匹配聯合,那么該中性刺激物就具備了強化的性質和作用。 條件性強化物本來不具有強化作用。例如,在斯金納的實驗中,真正的強化物是食物。但是,如果每次實驗都是先打開燈再給鴿子餵食,最後,中性的燈光就會成為條件性強化物。此時,燈光的作用和食物一樣,均能使操作條件化。斯金納指出,中性刺激物要獲得這種強化性質,須遵守這樣三條規則:一是中性刺激物與初級強化物的聯繫次數越多,它就越具有強化作用;二是中性刺激物與初級強化物出現的時間不應間隔太長;三是初級強化物如果不再出現,中性刺激物的強化力會迅速消失(類強化物不在此例)。 如果某種條件性強化物與不止一種初級強化物相匹配,那么該條件性強化物便能通過這些初級強化物而具備多方面的強化作用,從而成為一個“類強化物”,也可稱為概括性強化物。就是說,當一個中性物與兩個以上的初級強化物形成聯繫時,它就會發生類化。最典型的例子莫過於金錢,由於它與衣、食、住、行等初級強化物密切聯繫和匹配,因而具備了廣泛的強化作用。斯金納進一步指出,類強化物因為具有聯繫的廣泛性,即使沒有賴以為基礎的初級強化物伴隨出現,由於它總能同另外的初級強化物發生這樣那樣的聯繫,所以,它的強化效果依然存在。 在這種條件性強化物的組合中,需要注意的是,與中性刺激物相組合的初級強化物必須具有很大的強化力量。如果初級強化物本身沒有足夠的強化力量,就無法調動行為者的積極性,失去吸引力,與它組合的中性刺激物當然無效。所以,初級強化物存在著強化力的臨界點。在這個臨界點之上,它能使與其組合的中性刺激物獲得強化性質;在這個臨界點之下,即使它本身還有一定強化作用,但與其組合的中性刺激物不能獲得強化性質。

強化程式

在實驗中,斯金納發現強化與行為之間存在著一定的關係。如果強化的時間和比率不同,強化作用的效果也會大不相同。所謂強化程式,就是指反應受到強化的預先安排形式。對此,斯金納提出了一個著名的強化類型表。 根據這個強化類型表,一切強化可分為兩大類:一是連續性強化,即每次行為都受到強化;二是間歇性強化,即只是部分行為受到強化。間歇性強化又可按照時間和比率的不同分為以下四種:①固定間時強化,強化是定期的,如計時工資;②變動間時強化,強化是不定期的,如隨時進行的獎勵;③固定比率強化,強化按一定比率進行,如營業提成;④變動比率強化,強化按隨機比率進行,如彩票得獎、賭博輸贏等。 連續性強化和間歇性強化的效用,從行為的消退角度來看不盡相同。斯金納的實驗表明,間歇性強化停止後產生的反應消退,遠遠低於數量相同的連續性強化停止後產生的反應消退。例如,如果只是偶然對兒童的良好行為給予強化,在停止強化後,這種良好行為保持的時間,要比每一次良好行為都給予強化保持的時間長得多。斯金納認為,當手頭的強化物很有限時,這一差別具有實際意義。對於管理者來說,弄清間歇性強化與連續性強化在反應消退上的差別,進而弄清不同的間歇性強化在反應消退中的精確數據,對於設計激勵方案有著重要作用。 間歇性強化的各自特點和不同效果如下。 (1)固定間時強化:固定間時強化每隔一個固定時段進行一次,其效果受強化的大小、數量和及時性的影響。強化越大,數量越多,則反應機率越大。如果反應和強化物出現的時間之間有相當大的間隔,則反應機率較低。這種強化因間隔的固定性,有一定規律可循。因此,在強化物出現後,由於行為者知道短期內不能再得到強化,所以在每次強化之後的區間反應機率較低。當行為者覺得再次強化快要到來時,反應機率又會增加。例如,在計時工資制中,工資定時發放,在這段固定時間中,工人的反應並不會得到強化,工作的水平可能會下降。對於這一問題,可以通過厭惡性的條件強化物(如扣除薪金)來作為工資的補充。 (2)變動間時強化:變動間時強化可以用來調節行為的發生機率,它能夠消除強化物出現後的反應機率降低現象。由於這種強化程式沒有一定的時間規律,隨機性較大,行為者往往難以琢磨後續強化物出現的時間。因此,在它的作用下,能使行為者保持一個相對穩定的行為水平。 (3)固定比率強化:斯金納認為,固定比率強化能產生很高的反應機率。因為在這種程式的刺激下,行為者的反應速率達到固定比率就會得到強化,行為的結果又促使反應速率進一步提高。如果沒有其他因素干擾,這種程式能使激勵作用達到最大值。值得注意的是,斯金納強調,採用這種程式的關鍵在於“比率不是太高”。因為他的研究表明,某一特定的行為人和某一特定的強化指標之間,比率是有限的。超過這一比率,行為就不能保持,而且會出現快速消退。這種情況被斯金納稱為“行為缺失”。之所以會發生行為缺失,是因為行為人的能力和精力是有限的。如果固定比率過高,超出了行為人之所能,那么就會產生兩種情況:一是行為人在初始時就無法達到規定的比率;二是在初始時雖然達到了比率,但後來無法持續達到。一旦出現這種情況,肯定發生行為消退。在現實中,某些本來行之有效的業務提成或類似制度,由於後來不斷“加碼”而導致失效,就屬於這種情況。 (4)可變比率強化:可變比率強化是通過對受到強化的反應與未受到強化的反應之間比率的不確定性運用來進行激勵的。這樣,行為人對強化的力度(即自己的收益)不可預測。可變比率和固定比率的差別,同變動間時和固定間時的差別在邏輯上是一致的。所以,在理論上,它可以消除固定比率強化後所出現的反應消退現象。這種程式的比率幅度在變,但其平均值不變。所以,行為人的行為有可能得到高強化,也有可能得到低強化,或者很長時間得不到任何強化,而強化的平均值不變。行為人會根據這種隨機性來調整自己,保持一種穩定的行為速率。 斯金納主張綜合使用各種不同的強化程式。可以把比率強化和間時強化、固定強化和可變強化結合使用或者交替使用,從而對行為人的行為進行更好的調節。

管理學意義

任何管理手段,都要考慮實際運用中的可操作性,激勵也一樣。運用強化理論,在操作性方面,除了應當注意上文已經涉及到的持續性、適應性等問題外,還應注意強化的漸進性、時效性、正面性等方面。 (1)強化的漸進性。強化的漸進性包括兩個方面:第一,對行為強化的力度要有層次性和持續性;第二,對行為的期望不能設定太高的標準。 斯金納認為,對難度不同的行為應給予不同力度的強化,而且,對行為的強化應該具有持續性。例如,針對同樣的行為,一次給某人50美元進行強化,可能不如每次給他5美元而分為10次的強化效果好。 對行為人來說,強化是以相應行為的發生為基礎的;對管理者來說,總是當行為達到一定標準才給予強化的。如果給這種行為設定的目標過高,行為者不能達到,那么強化就不可能出現。這樣,對管理者而言,他所期望的行為沒有發生;對行為人而言,他的行為結果不能令自己滿意。過高的目標會使雙方都不能實現自己的預期。斯金納指出,人的行為不是一次性形成的,而是有一個連續形成的過程。所以,塑造人的行為,應該採用連續接近的方法,對趨向於所要塑造的反應方向予以不斷強化,直到引出所需要的新行為。也就是說,給某種行為制定的強化標準要具有漸進性和可及性。例如,如果要訓練鴿子或老鼠頭抬到一定的高度,就要當它的頭朝著實驗所需的方向抬起來時實施強化,下一次稍微再高一點,逐漸達到所需的方向和高度。這時,新的行為就塑造成了。在塑造行為時要注意這樣一條原則:行為人必須在他的能力所及的範圍內能得到強化,同時這些行為又必須能向新的行為水平延伸。在現實中,這種期望定位相當重要。例如,有一個三類高校,為了提高科研水平,在獎勵辦法中規定在《自然》和《科學》雜誌上發表文章者予以高額獎勵,力度確實夠大,但由於這兩個雜誌的發表標準對於普通教師來說要求過高,沒有可及性,因而這個獎勵辦法迎來的是教師的一片牢騷。企業管理中,動不動就以500強為標桿以及類似做法,常常會犯這種標準太高的失誤。 從漸進的角度看,差彆強化對於行為的改善具有重要意義。斯金納以“孩子為何哭鬧”為例來說明差彆強化。當小孩哭喊引起母親的抱怨時,母親可能並沒有意識到,正是她自己做出的強化行為,導致小孩的哭喊聲音越來越大。因為小孩根據自己的經驗,哭泣能夠引起母親的回應。一旦得不到回應,小孩可能會加大哭聲。而母親很有可能隨著哭聲的增大而提高回應機率,久而久之,小孩就會不斷增加哭喊的強度。可見,差彆強化主要用於調節現有行為水平。當行為水平需要改進時,就可以有步驟地適當調正強化標準。對於管理者來說,合理運用差彆強化,可以收到不斷改進之效。但必須注意的是,要提防差別過度導致行為缺失。另外,逆向的差彆強化不可小覬,有些管理者對某些需要制止的行為採用差彆強化,其結果則會適得其反。“亂世用重典”的經驗,就是因為在亂世背景下司法由輕到重的變化,極有可能使違法行為得到差彆強化反而增加犯罪。這種尺度到底如何掌握,需要根據環境條件做出準確判斷。 (2)強化的時效性。強化的時效性也包括兩個方面:第一,強化本身要具有時效性;第二,對強化的反饋要具有時效性。 強化的媒介是強化物。要使某種強化物對某種行為具有強化作用,前提就是要使行為與強化物之間形成緊密的相倚性聯繫,尤其是條件性強化物更是如此。斯金納認為,反應和強化物的出現之間如果有延遲,反應機率則較低。當反應與強化物之間的時間緊密相連時,行為和強化就能形成很強的相倚性聯繫;反之,隨著兩者間隔的延長,相倚性聯繫就會弱化,強化的效果也會不斷打折扣。 強化某種行為,依賴於行為人感到或者看到自己行為的結果。只有在這種情況下,行為人才能獲知自己的這種行為能否得到強化,它究竟會給自己帶來什麼。對於管理者而言,也需要及時看到強化的效果,才能恰當實施和調整後續強化手段。所以就需要及時雙向反饋。 (3)強化的正面性。以正強化為主,負強化為輔。 當行為的結果會帶來愉快和滿足,或者能消除不快和厭惡時,人們往往樂於接受,不會產生情緒上的不良反應,如恐懼、焦慮等,這恰恰是正強化的效用。正強化是使合意行為的發生機率增大,負強化是使不合意行為的發生機率降低。管理的基本目的是促進人們乾正事,而不是僅僅防範人們乾錯事。如果負強化優先,就失去了管理的存在價值。所以,正強化是必須採用的手段,而負強化是不得不用的手段。 就強化效果而言,負強化的兩種方式—懲罰性強化和消退性強化,其中消退性強化往往能收到較好的效果而副作用不明顯,懲罰性強化的短期作用顯著而副作用強烈。這種副作用來自於剝奪性和強制性,是無法克服的。 斯金納認為,懲罰有三個作用:①可以制止眼前的行為但不對以後的行為起作用;②通過連續懲罰可以壓抑某種行為;③引導人們形成某種被允許的行為即規避。從長遠來看,懲罰實際上並不能消除相應的行為。例如,禁酒並不能減少酒類供應量,壓抑青春期躁動有可能加劇青少年的反叛,禁止異性接觸反而可能會增大同性戀的幾率,等等。所以,懲罰雖然具有立竿見影的效果,但是會付出很大的代價。因為懲罰會降低團體的工作效率和滿意感,會導致規避甚至報復。另外,懲罰能引起恐懼、焦慮和其他情緒反應,這種狀況長期存在可能會干擾人們的正常行為。因此,斯金納認為,在進行強化時應儘量運用除懲罰以外的其他強化方式。例如,改變有可能引起不良行為的環境,“冷處理”,用正強化來抗衡等等。 管理學所研究的問題歸納起來,不外是如何調控人的行為。然而,人的行為到底是怎樣產生的?行為的機制是什麼?弄清這些,對於管理學具有重要意義。但恰恰在這些問題上,學者們爭論得一塌糊塗。針對這些問題,斯金納從科學立場出發,強調人的行為不是由人的內在心理活動來決定的,而是源於外部環境,行為是在環境中各種刺激因素綜合作用下所引起的反應。他指出,從導致人的行為發生的影響變數上來講,人的行為在很大程度上是由環境決定的。在一定意義上,人的行為就是環境的產物。行為與環境之間有著很強的相倚聯繫。環境的改變在很大程度上也能改變人的行為,而人的行為又在不斷改變著環境。由此,他提出了一種新的理論—操作性條件反射理論。

應答性行為和操作性行為

現代對人類行為的研究,源於俄國著名學者巴甫洛夫的“條件反射”理論。巴甫洛夫在20世紀初,通過對狗的實驗,發現“無條件刺激”和“條件刺激”的銜接會產生出反應的相關性。狗看見肉就會分泌唾液,這是無條件刺激產生的反應。而當肉的出現同另一個新的刺激(如搖鈴)同時發生時,會引起條件反應。經過多次重複,即使沒有肉,一搖鈴也會引起狗的唾液分泌,這就是條件反射。這說明,有機體的行為是外部各種刺激相互作用引起的反應,與心理活動無關。由此,巴甫洛夫奠定了學習機制和強化機制的科學基礎。 之後,美國心理學家華生於1913年發表了《行為主義者眼中的心理學》一文,學界通常認為,這篇文章是行為主義心理學誕生的標誌。華生推廣了巴甫洛夫的“刺激-反應”原理,提出人的學習行為具有兩條主要的規律:頻因律近因律。在華生眼裡,心理學必須是嚴格的自然科學式的,不能關注那些不可測量、不可驗證的“內心”,而只能研究可測量、可驗證的行為。 斯金納繼承和發展了巴甫洛夫與華生的研究成果,而且走得更遠。他堅信,人類行為同其他動物的行為沒有本質區別,基於動物的行為研究,所發現的可實驗、可重複的規律同樣可以用到人身上。經過對有機體行為的研究,斯金納認為華生所堅守的“沒有刺激,就沒有反應”的信條是不全面、不準確的,進而提出了“引發反應”與“自發反應”兩個概念。如果是因為某種刺激的出現才發生的行為,就是“引發反應”;如果沒有明顯的外在刺激而自主發生的行為,就是“自發反應”。引發反應是先有刺激後有行為,而自發反應是先有行為後有刺激。之所以要區分這兩種行為反應模式,是因為引發反應不具有可操作性,而自發反應具有可操作性。在這裡,“可操作性”是一個十分重要的概念,其準確含義是自控而不是他控。 依據對行為的兩種反應的區別,斯金納提出了人的兩種行為模式:應答性行為和操作性行為。應答性行為是指由特定的、可觀察到的刺激所引起的行為,如巴甫洛夫的狗。操作性行為是指在沒有可觀察到的外部刺激的情境下發生的行為,它是自發的,如斯金納箱中的白鼠和鴿子(見後)。 應答性行為實際上屬於被動行為。它由刺激所控制,刺激的強弱和頻率直接制約著行為的發生機率及其效果。在這個過程中,行為受制於環境,做出行為是為了獲得刺激,這就是工具性條件反射。操作性行為實際上屬於主動行為,它能對環境做出主動適應,是由行為的後果反過來控制下一步行為的。如果行為的後果能產生積極效應,使行為者獲得較大的滿足,那么這種行為就能得到正強化,使得該行為在以後發生的機率增大;如果行為的結果未能使行為者感到滿足或滿足程度不夠,包括使行為者失望,這種行為就得到負強化,行為主體就會自動調節自己的行為,使這種行為在以後發生的可能性降低。 斯金納的這一區分,在激勵理論的發展上具有重要意義。可以說,從他開始,奠定了後來管理理論中x理論和y理論區分的心理學基礎。

斯金納箱和操作性條件反射

斯金納的操作性反射是針對人的行為的控制而提出的。他認為,人類的行為總有它產生的原因,通過發現和分析這些原因,就可以在一定程度上預測和控制人的行為。因此,只有了解和掌握影響行為的所有變數和原因,才能形成對行為的有效控制。他認為,任何行為的因果鏈都包括三個環節:①從外部對有機體進行的操作,如剝奪飲食;②內部狀態,如飢餓;③行為,如覓食。斯金納認為,當時的心理學試圖從內部狀態即心理感受上尋找行為原因,但是,這種內部狀態是無法用科學加以測量和驗證的,而內部狀態依賴於外部操作,所以,科學的心理學應該避開無法測度的第二環節,直接建立起第一環節和第三環節之間的函式關係。從這種科學思維出發,斯金納強調人的行為是環境的產物,人的行為取決於環境所給予的強化,人們完全可以通過改變環境和運用各種強化手段來改造和控制人的行為。正是在這種科學信念上,斯金納繼承了華生的觀點。華生曾經提出,心理學要徹底摒棄意識、意志之類辭彙,放棄一切對內在心理的猜測,而只對可測量的外顯行為進行研究。儘管華生由於“不愛江山愛美人”,因婚變而離開了學界。但斯金納繼承了他的衣缽,並用“斯金納箱”進行的白鼠實驗,證實了行為可以由外界因素加以塑造。 所謂“斯金納箱”,是一個高約1尺的長方形箱子。它一面是單向玻璃,用來觀察動物而不驚擾它。箱內有照明小燈,並有一根連線著食物台的槓桿或踏板,當動物按壓槓桿時,它可以得到食物。裡面的記錄裝置可以把動物的按壓反應記錄下來。在實驗中,要求排除一切外來刺激,讓動物自由活動。 斯金納箱的實驗,與巴甫洛夫有著明顯不同,它可以全面顯示出動物的學習行為(斯金納自己很少使用“學習”這一辭彙,因為他反感這一辭彙含有的內在性,通常他只用“強化”來表達人們常說的“學習”)。白鼠在箱子內自由活動,會偶然發現按壓槓桿能得到食物,於是,白鼠就可能調正或改變自己的行為。它會再次按壓槓桿,試圖獲得更多的食物。有意思的是,如果調整強化物的提供方式,白鼠的行為也會產生“聰明”的變化。比如,如果按壓槓桿後必須間隔1分鐘才再次供給食物,那么,白鼠在多次重複後,會把自己的行為調整為間隔1分鐘左右才再次按壓槓桿。如果每按壓10次才掉下來一次食物,那么,白鼠也會逐步摸索,形成10次按壓後停下來去取食物的行為慣性。由此可以說明,學習的本質不是刺激的替代或內心的追求,而是反應的改變。顯然,斯金納已經超越了巴甫洛夫的應答式條件反射,進而提出了操作性條件反射。所謂操作性條件反射,不是由外界刺激引起的,而是由主體行為觸發的。只要出現相應的條件,即強化物和行為之間形成了明顯的相倚關係,那么,相應的行為就會出現。斯金納認為,某人之所以產生某一行為,是由於想得到過去同類行為所產生的某種結果,而不能說是由於想得到該行為將要產生的結果。這話聽著拗口,但不這樣說就弄不清兩種條件反射的差別。歸根到底,操作性行為最明顯的特徵是自發的,而不是誘發的。 那么,這種操作性行為能否得到維持,維持的時間長短,就成為激勵重要內容。斯金納認為,這取決於行為結果。想要一種行為長久維持下去,就必須給這個行為予以強化。換句話說,就是要使行為者感覺到這個行為是與一定的強化物相聯繫的。如果自己想要得到這種強化物,或者通過這種強化物來獲得別的東西,從而使自己的需求得到滿足,就必須做出這種行為。反之,則要避免這種行為。可見,只有把行為與一定的強化聯繫起來,才能達到預定的目的。這種聯繫就是強化與反應之間的相倚性聯繫。 對行為的強化是通過強化物來起作用的,要選擇適當的強化物就需要辨明哪種事物能對行為產生有效的作用。如果某種東西在使用前和使用後能夠觀察到反應頻率的變化,這種東西就具有強化作用。人的行為是一個“習得”的過程。在這個過程中,如果沒有一定的強化激勵來暗示或明示這種行為是否正確,那么行為者就沒有評判標準。當某種強化物在行為者行為發生後給予相應的激勵刺激,那么行為者就會認識到自己行為能帶來什麼樣的後果,進而決定是否需要維持下去。偶然一次的激勵,不能形成相倚性聯繫。只有行為結果出現後能得到持續(或遞增或遞減或隨機或間隔,隨機和間隔也是持續的表現方式)的強化,如此反覆,行為就會與強化物形成緊密的相倚性聯繫。這種聯繫的強弱會影響以後行為維持的程度和時間的長短。相倚性聯繫越強,則行為維持的程度越強,時間越長;相倚性聯繫越弱,則行為維持的程度越弱,時間越短。

反射的強化

人類的行為,多數是經過強化而形成的操作性行為。也就是說,行為是可塑的。斯金納把行為的可塑性作為他研究的依據,行為既然有可塑性,也就是說可以促使某種行為發生,或者抵制某種行為出現,這種願望的實現恰恰是通過強化作用來實現的。與以往的理論不同處在於,斯金納強調,強化作用不是取決於強化物的有無或大小,而是取決於強化物和行為的聯繫。相倚性聯繫的建立是強化不斷延續的結果。當一種行為發生後帶來了強化物,最初的強化刺激就形成了。只要這種行為和強化多次重複,就能形成分辨性刺激,行為主體會自行區分相倚性聯繫。例如,微笑意味著讚許,而皺眉意味著異議,這種判斷就是來自於經驗歸納的分辨性刺激。一旦行為主體認知到了相倚性聯繫,那么這種行為的可操作性就已經建立了。隨後,可以通過控制強化的強度和頻率來調節行為。假如這種行為是強化實施者所期望的行為,那么通過運用恰當的強化物,這種行為就會得到強化,從而導致這種行為出現的機率增大;反之,假如這種行為不是強化實施者所期望的行為,那么通過不同的強化物,這種行為會受到負強化,從而導致這種行為發生的機率降低,甚至為零。
依據這個原理,斯金納認為人的行為是可以塑造的,而其塑造手段是通過強化來進行的。強化的效果,要受強化物種類的選擇、強化方式的選擇、強化程式的安排等因素影響。要使行為發生的機率增加,可以通過正強化物,使行為者得到這種行為的相應收益,使自己需求得以滿足;反之,要使行為發生的機率減少,則可通過相應的負強化物來實現。

相關詞條

相關搜尋

熱門詞條

聯絡我們