響片訓練是一種訓練動物的方式,它使用制約增強的方法來“表示”(標記)動物當下正在做的行為是正確的。響片訓練原本用在不適合傳統服從訓練的動物身上,如海豚和鴿子。由於動物訓練者使用這個小型會發出聲音被稱作“響片”的東西來做訓練,所以儘管它使用的是操作制約的方式,但人們還是使用“響片訓練”這個名詞,響片訓練也成功的運用在馬只訓練和綿羊身上。
B·F·斯金納是第一位定義和描述操作制約原理的學者,而斯金納的兩位學生瑪蕊安·卜利廉同凱勒·卜利廉夫婦兩人觀察出將之套用在動物訓密密麻麻練的可能性,並發展出如今為人們所熟知的正增強方式和塑型法。
其發展開始於二次大戰的鴿子計畫,卜利廉夫婦開辦了一間公司名為“動物行為企業”。他們在海軍和公開展覽中舉辦了第一次海上哺乳動物訓練計畫,並首創鳥兒自由飛翔秀,舉辦商業動物展覽,其內容包括乳豬競賽和雞隻玩圈叉遊戲等,可說是一整個“IQ動物園”。
1965年凱勒過世後,瑪蕊安嫁給首位參予研究海軍海豚科學專家貝里·鮑伯。在海洋中,海豚可以找到離訓練者好幾哩以外的目標物。帶著相機的貓可以沿著城市行走進入建築物,載著相機藉由雷射光導向的渡鴉或其他鳥類可以飛到某座某摩天樓的特定窗戶並且照攝裡面的人。海鷗——大自然的海洋搜尋專家,可以找到並且回報救生艇和遠離岸邊的游泳者。
訓練動物的挑戰之一,就是要跟動物溝通如何讓它們準確地知道所發生的行為正是訓練者嘗試要去加強的。舉一個簡單的例子,訓練狗兒退後,正當狗兒要往後移動的同時訓練者馬上就要讓狗兒知道它目前所做的事是正確的。然而,以往傳統的口頭鼓勵方式“乖狗兒!”會花掉太多時間,在稱讚的同時狗兒可能已經繼續其他的行為了。而當狗兒了解它正在被獎勵時,這行為可能又重複了一次或甚至是坐下和搔癢。另外,不精準的時間點和訓練者音調所傳達的訊息也會讓實際接受的信號意思因而有所不同。在同一段訓練時間當中,訓練者的聲音、發音、音調、音量和重音可能都會有所改變,這會使訓練進度減慢,因為動物必須要去理解某些變化(例如訓練者的音量或是熱忱)是不重要的,而某些變化卻是需要去注意的(例如“好乖”或“不對”)。制約加強法可以解決這些問題,它使用的可以是任何一種動物可以察覺的信號,只要這信號是簡短(避免不準確的時間點)而且是一致的(避免動物對信號的變換產生混淆)。通常都是用響片或是信號器這種壓下和放掉時會發出“喀喀”的小型金屬片來訓練狗或馬,至於海豚,在制約加強法當中通常是使用口哨。然而並非都是使用聲音來操作制約加強法,我們使用手電筒快速閃光來取代響片訓練金魚,使用會震動的項圈來訓練耳聾的狗兒。
響片訓練當中有幾點常見的問題,依賴使用響片給狗兒信號便是其中之一,響片主要是使用在教導新的行為,或是給予穩定的音調獎勵,等過了這個階段以後響片便不需要了(或是不用依賴)。有時候狗兒發生期望中的行為時響片正好不在手邊,這時候仍然可以用其他的“喀喀”聲來代替,儘管獎勵效果不如響片,但當下發生的行為仍然還是需要被標記。
另一個會遇到的問題是,當團體上課時狗兒會無法辨別哪一個響片發出來的聲音是屬於它的,然而每年有上百個響片團體課程在舉辦,這證明了此憂慮是多餘的。在某些情況當中響片音量可能不夠大聲,例如狗兒離開操作者去做狩獵或拾回動作,也有些狗兒對於聲音敏感或是害怕響片。針對這類狀況可以轉換標記工具來解決問題,像是操作者在做遠距離訓練時可以使用口哨來代替,對聲音敏感的狗兒可以使用原子筆蓋或是訂書機取代。同樣地,當響片訓練已經進行後,也可以使用這技巧來解決很多上述提到的問題。
當狗兒要學習如何去碰觸特定目標物時,大部分一開始期望的行為都是從鼻子碰觸開始,像是用鼻子碰觸一小片塑膠,而這訓練可以轉換成實用的任務或是有趣的把戲,像是開關燈或是想到戶外的時候搖鈴當。
訓練鼻子碰觸的方法從讓狗兒用鼻子去碰觸目標物開始,有些訓練者使用引導法,例如將花生奶油醬輕塗在小碟子或是塑膠目標物上,而有的訓練者偏愛使用雕塑法,也就是將目標物放在容易碰觸的地方,像是手握著放在訓練者和狗兒中間,當狗兒一往目標物靠近或真正碰觸就給予獎勵。
當狗兒可以不斷地碰觸目標物後,訓練者就可以將獎勵食物去除並變換目標物位置。最後訓練者可以將此行為轉換成搖鈴當,舉例來說,把鈴鐺放在目標物前面,每次狗兒都必須要先碰觸鈴鐺才會碰觸到目標物,這時候獎勵每次碰觸到鈴鐺的行為。當狗兒可以確實碰觸鈴當後,訓練者加入開門的動作來當作獎勵狗兒每次碰觸鈴當的行為。
訓練馬兒的標的物法:對馬兒來說,通常不用先將響片“充電”或是“裝滿料”,因為對馬兒來說最好的方法就是清楚的標記讓馬兒不要期待“尚未獲得”的零食。
響片訓練法有三種方式:一種是誘導法(Magnet),一種是捕捉法(Capture),另一種是塑造法(Shaping)。誘導法較為快速但是並不精確,常常會導致混淆或困惑的情況發生,捕捉法較自然兒精確,但是初期訓練時間教長。塑造法其實是將欲訓練的行為或動作分解成許多相近的步驟再一一以捕捉法訓練並連貫相近的步驟來連成我們欲訓練的行為或動作。
誘導法(Magnet):利用零食誘導狗狗產生訓練者期望的行為或動作一但狗狗做對了,按下響片,並隨之給予零食獎勵。
捕捉法(Capture):完全不使用零食、手勢或聲音…等提示,細微地觀察狗狗的行為或動作,一但狗狗發生訓練者期望的行為或動作時,立刻按下響片並隨之給予零食獎勵。
塑造法(Shaping):完全不使用零食或手勢等提示,細微地觀察狗狗的行為或動作,一但狗狗開始「朝向」訓練者期望的行為或動作反應時,立刻按下響片並隨之給予零食獎勵。也可以說是將訓練者期望的行為或動作分解步驟,各步驟都以捕捉法來訓練,逐漸連成訓練者期望的行為或動作。