習慣性行為和目標導向行為

我的早餐

剛來美國的時候，早餐成了我頭疼的問題。

馬里蘭州大農村的便利程度遠比不上中國的小縣城，方圓幾里地一個商店都沒有，更別提出門右拐就有的豆漿、包子、油條和豆腐腦了。無奈之下，我也吃起了麵包和牛奶。因為它們方便買到、花費時間少，微波爐裡稍微一熱就可以解決早餐。

在很長一段時間裡，每天早上我像程式設定好的一樣，開啟冰箱，拿出麵包、匯出牛奶，放到微波爐裡分別加熱，咕咚咕咚，吧唧吧唧，十分鐘內解決早餐，然後趕著去工作。麵包和牛奶已經成了我的習慣。

直到有一天和朋友聊天，談到早餐的問題。他說，早上你真的想吃牛奶和麵包嗎？我愕然。我從來沒有想過這個問題，說實話，麵包和牛奶並不是我理想中的早餐，僅僅是因為我養成了早上吃它們的

習慣

。

我又開始思考早上吃什麼的問題。我在大中華超市買了包子、小米、玉米糝、蛋糕等等，甚至專門買了一個小煎鍋來煎雞蛋。之後，每天早上醒來，我砸吧下嘴裡的滋味，思考吃什麼，然後開始折騰“理想中”的早餐。如今，我的早餐取決於我想吃什麼（當然也是在有限的幾種食材中做選擇），換句話說，我選擇做什麼樣的早餐取決於我的

需求

、我的

渴望

，或者說取決於某種早餐對我的

價值

。

我的早餐演化史中，有兩種行為。一種是習慣性的行為（

habitual behavior

），一種是目標導向的行為（

goal-directed behavior

）。

為了更好的理解這兩種行為，我們再看一個例子。

球球的果汁

球球是一隻勤勤懇懇的獼猴，因為肚子胖的圓嘟嘟，所以大家都叫他球球。他的工作是每天乘坐貼身輪椅去一個降噪房間裡，盯著電腦做任務。他的報酬是蘋果汁、葡萄汁、芒果汁等各種口味的果汁。週一到週五，每天工作兩個小時，週六週日休息。

電腦螢幕上左右兩邊分別呈現不同數量和顏色的小方塊，球球經過幾天的學習，知道紅色、藍色分別代表蘋果汁和葡萄汁，方塊的數目代表果汁的滴數。當球球把目光從螢幕中間移動到左邊或右邊時，對應滴數和口味的果汁會透過一個鐵質的吸管噴入口中。

球球需要在不同口味和數量的果汁中做出選擇

球球喜歡蘋果汁，清甜利口。但同時球球也口渴，他想得到更多的水。球球要在不同滴數的蘋果汁和葡萄汁間做選擇。球球都要在腦子裡想象，一滴蘋果汁和兩滴葡萄汁哪個更有價值？兩滴蘋果汁和六滴葡萄汁哪個更有價值？…… 當葡萄汁足夠多時，球球選葡萄汁，因為可以大大緩解口渴。當面對一滴蘋果汁和兩滴葡萄汁時，球球選一滴蘋果汁，因為葡萄汁的滴數不夠多，而蘋果汁的誘惑又太大。也就是說，這時的球球，每次做選擇時，都要

實時地比較兩個選項對自己的價值，這裡的價值是由需求決定的，因此，他的行為是由自己的需求驅動的

。

經過幾個星期的訓練後，球球對所有的選項組合都已瞭然於胸，他發現了一個省力的方法。六個藍色方塊對兩個紅色選兩個藍色，一紅一藍選一紅，一紅兩藍選一紅…… 球球不再思考，兩個選項一出現，他就知道哪個是最優的。訓練過度的球球，他的選擇行為不再由選項的價值驅動，而是由選項組合的視覺刺激驅動。也就是說，球球現在的

行為是由刺激（視覺）引發的

。

兩種行為，兩種聯結

總結之前兩個例子，目標導向行為是人們以當前的需求為目標，比較不同行為能收穫的價值，然後執行價值最大的行為。個體透過

行為-結果聯結

來推測哪種行為能最大化地滿足當前的需求。目標導向行為對行動的結果敏感，如果行動的結果不能滿足當前的需求，個體會很快調整行為模式。

習慣性行為是一種不經過大腦思考的習慣性動作。在刺激和行為無數次的依次發生後，刺激和行為之間已經形成了非常強的連線，刺激的出現就足以引發動作。因此，

習慣性行為透過刺激-反應聯結來觸發行為

。習慣性行為允許人們快速地做出正確選擇，節省腦力資源。

習慣性行為對應刺激-反應聯結，而目標導向行為對應反應-結果聯結

從球球的例子中可以看出，目標導向行為在學習的初期占主導地位。隨著學習的深入，個體會從過去的經驗中總結出最佳的行為模式，而這種最佳行為模式可以在該任務中獲取最大化的價值。也就是說，在學習的後期，習慣性行為佔主導。

目標導向行為和習慣性行為並不是對立的，它們可以相互轉化。當人們面對不熟悉的狀況時，其行為往往以目標為導向。而當一種狀況反覆的、一模一樣的出現時，人們的行為會趨向於習慣化。而當習慣化行為的結果發生意想不到的變化時，人們會重新返回價值導向的行為，再次思量不同行為的結果，以實現利益最大化。

如何區分習慣性行為和目標導向行為？

如果你是一個觀察者，你看著我早上開啟冰箱，拿出牛奶和麵包。你看著球球選擇了他最愛的蘋果汁，你能知道我們的行為是習慣性的還是目標導向的嗎？

不能。

除非我告訴你我腦子裡在想什麼。但球球沒法告訴你，他是猴子他不會說話，你只能透過他的行為去推測。因此你需要另外的行為測試來判定猴子的行為到底屬於哪一種。

我們知道，習慣化行為是由刺激驅動的，而不會思考行為產生的結果，而目標導向行為則會根據行為結果靈活調整行為。因此，改變行為的結果在短期內就只會影響目標導向行為，而不會影響習慣化行為。

結果貶值測試（

outcome devaluation test

）是科學界公認的區分兩種行為的標準實驗。

舉一個簡單的小鼠例子。行為箱裡有一個鐵桿，小鼠按壓會有糖球獎勵。經過訓練後，小鼠每次進入行為箱都會瘋狂按壓。如果在進入行為箱之前，給小鼠一大盒子糖球讓它吃個夠。如此一來，糖球對小鼠來說價值就降低了，因為它已經吃膩了。這就是結果貶值的操作。

小鼠壓桿的devaluation測試

還有一種常用的貶值手段，是讓小鼠把糖球和疾病聯絡起來。比如，每次小鼠吃完糖球就給它來一針LiCl，讓小鼠噁心難受，重複幾次，小鼠就把這樣糖球和疾病聯絡了起來，糖球對小鼠也就沒有了食用價值。

然後，我們把小鼠放進行為箱。

如果小鼠按壓控制桿的次數大大減少，那就說明小鼠的行為是目標導向的行為，因為壓桿的結果糖球已經對它沒有價值了，小鼠及時得調整了自己的行為。

如果小鼠依舊瘋狂按壓控制桿，那就說明小鼠的行為是習慣性行為，因為它壓桿時根本沒有考慮糖球已經沒有了食用價值，它只是在做一個控制桿引發的習慣性動作。

目標導向行為受貶值測試的影響，而習慣化行為不受影響

再用球球舉個例子。球球愛吃蘋果勝過葡萄，實驗前，我們讓球球把蘋果吃到吐。當球球面對代表香蕉的紅方塊和代表葡萄的藍方塊時，如果球球依舊頻繁選擇蘋果，那麼球球的選擇行為是習慣性的。反之，則是目標導向的。

訓練期間猴子學習不同形狀對應的食物。貶值測試時，先讓猴子吃某一種食物吃個夠

總結

習慣化行為的形成允許大腦高效、迅速、節能地處理頻繁出現的問題，而目標導向行為則是人們處理新問題時的慣用策略。

其實，兩種行為是操作性條件反射（或工具性條件反射）的兩個過程。在操作性條件反射裡，動物看見控制桿，按壓控制桿，然後獲得獎勵。習慣性操作只聚焦控制桿和按壓動作，而目標導向行為更關注按壓和獎勵之間的聯絡。

在接下來的文章裡，我將講述介導習慣化和目標導向性行為的腦區和神經環路，歡迎關注。

（作者生物流系頭條號簽約作者）

小蜜蜂問答

小蜜蜂問答

習慣性行為和目標導向行為

推薦文章

小蜜蜂問答

小蜜蜂問答

習慣性行為和目標導向行為

相關文章

有什麼好的公狗名字？

佛陀不回答的問題

陳翔6點半你最喜歡誰？為什麼？

有哪些你認為十分美味，但外鄉人吃不慣的家鄉美食？

推薦文章