我的早餐

剛來美國的時候,早餐成了我頭疼的問題。

馬里蘭州大農村的便利程度遠比不上中國的小縣城,方圓幾里地一個商店都沒有,更別提出門右拐就有的豆漿、包子、油條和豆腐腦了。無奈之下,我也吃起了麵包和牛奶。因為它們方便買到、花費時間少,微波爐裡稍微一熱就可以解決早餐。

在很長一段時間裡,每天早上我像程式設定好的一樣,開啟冰箱,拿出麵包、匯出牛奶,放到微波爐裡分別加熱,咕咚咕咚,吧唧吧唧,十分鐘內解決早餐,然後趕著去工作。麵包和牛奶已經成了我的習慣。

習慣性行為和目標導向行為

直到有一天和朋友聊天,談到早餐的問題。他說,早上你真的想吃牛奶和麵包嗎?我愕然。我從來沒有想過這個問題,說實話,麵包和牛奶並不是我理想中的早餐,僅僅是因為我養成了早上吃它們的

習慣

我又開始思考早上吃什麼的問題。我在大中華超市買了包子、小米、玉米糝、蛋糕等等,甚至專門買了一個小煎鍋來煎雞蛋。之後,每天早上醒來,我砸吧下嘴裡的滋味,思考吃什麼,然後開始折騰“理想中”的早餐。如今,我的早餐取決於我想吃什麼(當然也是在有限的幾種食材中做選擇),換句話說,我選擇做什麼樣的早餐取決於我的

需求

、我的

渴望

,或者說取決於某種早餐對我的

價值

我的早餐演化史中,有兩種行為。一種是習慣性的行為(

habitual behavior

),一種是目標導向的行為(

goal-directed behavior

)。

為了更好的理解這兩種行為,我們再看一個例子。

球球的果汁

球球是一隻勤勤懇懇的獼猴,因為肚子胖的圓嘟嘟,所以大家都叫他球球。他的工作是每天乘坐貼身輪椅去一個降噪房間裡,盯著電腦做任務。他的報酬是蘋果汁、葡萄汁、芒果汁等各種口味的果汁。週一到週五,每天工作兩個小時,週六週日休息。

電腦螢幕上左右兩邊分別呈現不同數量和顏色的小方塊,球球經過幾天的學習,知道紅色、藍色分別代表蘋果汁和葡萄汁,方塊的數目代表果汁的滴數。當球球把目光從螢幕中間移動到左邊或右邊時,對應滴數和口味的果汁會透過一個鐵質的吸管噴入口中。

習慣性行為和目標導向行為

球球需要在不同口味和數量的果汁中做出選擇

球球喜歡蘋果汁,清甜利口。但同時球球也口渴,他想得到更多的水。球球要在不同滴數的蘋果汁和葡萄汁間做選擇。球球都要在腦子裡想象,一滴蘋果汁和兩滴葡萄汁哪個更有價值?兩滴蘋果汁和六滴葡萄汁哪個更有價值?…… 當葡萄汁足夠多時,球球選葡萄汁,因為可以大大緩解口渴。當面對一滴蘋果汁和兩滴葡萄汁時,球球選一滴蘋果汁,因為葡萄汁的滴數不夠多,而蘋果汁的誘惑又太大。也就是說,這時的球球,每次做選擇時,都要

實時地比較兩個選項對自己的價值,這裡的價值是由需求決定的,因此,他的行為是由自己的需求驅動的

經過幾個星期的訓練後,球球對所有的選項組合都已瞭然於胸,他發現了一個省力的方法。六個藍色方塊對兩個紅色選兩個藍色,一紅一藍選一紅,一紅兩藍選一紅…… 球球不再思考,兩個選項一出現,他就知道哪個是最優的。訓練過度的球球,他的選擇行為不再由選項的價值驅動,而是由選項組合的視覺刺激驅動。也就是說,球球現在的

行為是由刺激(視覺)引發的

兩種行為,兩種聯結

總結之前兩個例子,目標導向行為是人們以當前的需求為目標,比較不同行為能收穫的價值,然後執行價值最大的行為。個體透過

行為-結果聯結

來推測哪種行為能最大化地滿足當前的需求。目標導向行為對行動的結果敏感,如果行動的結果不能滿足當前的需求,個體會很快調整行為模式。

習慣性行為是一種不經過大腦思考的習慣性動作。在刺激和行為無數次的依次發生後,刺激和行為之間已經形成了非常強的連線,刺激的出現就足以引發動作。因此,

習慣性行為透過刺激-反應聯結來觸發行為

。習慣性行為允許人們快速地做出正確選擇,節省腦力資源。

習慣性行為和目標導向行為

習慣性行為對應刺激-反應聯結,而目標導向行為對應反應-結果聯結

從球球的例子中可以看出,目標導向行為在學習的初期占主導地位。隨著學習的深入,個體會從過去的經驗中總結出最佳的行為模式,而這種最佳行為模式可以在該任務中獲取最大化的價值。也就是說,在學習的後期,習慣性行為佔主導。

目標導向行為和習慣性行為並不是對立的,它們可以相互轉化。當人們面對不熟悉的狀況時,其行為往往以目標為導向。而當一種狀況反覆的、一模一樣的出現時,人們的行為會趨向於習慣化。而當習慣化行為的結果發生意想不到的變化時,人們會重新返回價值導向的行為,再次思量不同行為的結果,以實現利益最大化。

如何區分習慣性行為和目標導向行為?

如果你是一個觀察者,你看著我早上開啟冰箱,拿出牛奶和麵包。你看著球球選擇了他最愛的蘋果汁,你能知道我們的行為是習慣性的還是目標導向的嗎?

不能。

除非我告訴你我腦子裡在想什麼。但球球沒法告訴你,他是猴子他不會說話,你只能透過他的行為去推測。因此你需要另外的行為測試來判定猴子的行為到底屬於哪一種。

我們知道,習慣化行為是由刺激驅動的,而不會思考行為產生的結果,而目標導向行為則會根據行為結果靈活調整行為。因此,改變行為的結果在短期內就只會影響目標導向行為,而不會影響習慣化行為。

結果貶值測試(

outcome devaluation test

)是科學界公認的區分兩種行為的標準實驗。

舉一個簡單的小鼠例子。行為箱裡有一個鐵桿,小鼠按壓會有糖球獎勵。經過訓練後,小鼠每次進入行為箱都會瘋狂按壓。如果在進入行為箱之前,給小鼠一大盒子糖球讓它吃個夠。如此一來,糖球對小鼠來說價值就降低了,因為它已經吃膩了。這就是結果貶值的操作。

習慣性行為和目標導向行為

小鼠壓桿的devaluation測試

還有一種常用的貶值手段,是讓小鼠把糖球和疾病聯絡起來。比如,每次小鼠吃完糖球就給它來一針LiCl,讓小鼠噁心難受,重複幾次,小鼠就把這樣糖球和疾病聯絡了起來,糖球對小鼠也就沒有了食用價值。

然後,我們把小鼠放進行為箱。

如果小鼠按壓控制桿的次數大大減少,那就說明小鼠的行為是目標導向的行為,因為壓桿的結果糖球已經對它沒有價值了,小鼠及時得調整了自己的行為。

如果小鼠依舊瘋狂按壓控制桿,那就說明小鼠的行為是習慣性行為,因為它壓桿時根本沒有考慮糖球已經沒有了食用價值,它只是在做一個控制桿引發的習慣性動作。

習慣性行為和目標導向行為

目標導向行為受貶值測試的影響,而習慣化行為不受影響

再用球球舉個例子。球球愛吃蘋果勝過葡萄,實驗前,我們讓球球把蘋果吃到吐。當球球面對代表香蕉的紅方塊和代表葡萄的藍方塊時,如果球球依舊頻繁選擇蘋果,那麼球球的選擇行為是習慣性的。反之,則是目標導向的。

習慣性行為和目標導向行為

訓練期間猴子學習不同形狀對應的食物。貶值測試時,先讓猴子吃某一種食物吃個夠

總結

習慣化行為的形成允許大腦高效、迅速、節能地處理頻繁出現的問題,而目標導向行為則是人們處理新問題時的慣用策略。

其實,兩種行為是操作性條件反射(或工具性條件反射)的兩個過程。在操作性條件反射裡,動物看見控制桿,按壓控制桿,然後獲得獎勵。習慣性操作只聚焦控制桿和按壓動作,而目標導向行為更關注按壓和獎勵之間的聯絡。

在接下來的文章裡,我將講述介導習慣化和目標導向性行為的腦區和神經環路,歡迎關注。

(作者生物流系頭條號簽約作者)