誰能把納什均衡給講清楚點？

老虎1492978692018-04-23 18:36:54

一天一個人餵雞，對雞說，好好吃吧，明天就殺你了，第二天，見雞已自殺，並留下遺書，爺也不好惹的，想吃我，沒門。納什均衡告訴我們，當知道對手的選擇時，選擇一個最佳應對。納什均衡就是給定你的選擇，我的選擇是最好的，給定我的選擇，你的選擇是最好的

李永樂老師2018-04-23 17:37:59

納什均衡是博弈論中的一個規律，指的是在一個博弈過程中，博弈雙方都沒有改變自己策略的動力，因為單方面改變自己的策略都會造成自己收益的減少。納什均衡點可以理解為個體最優解，但並不一定是集體最有解。

為了解釋這個問題，我們舉兩個最典型的例子：囚徒困境和智豬博弈。

囚徒困境

囚徒困境是說：有兩個小偷集體作案，然後被警察捉住。

警察對兩個人分別審訊，並且告訴他們政策：

如果兩個人都交代坦白，就可以定罪，兩個人各判八年。

如果一個人交代另一個不交代，那麼一樣可以定罪。但是交代的人從寬處罰，批評教育就釋放。不交代的人從嚴處罰，判十年。

如果兩個人都不交代，沒法定罪，每個人判一年意思一下。

兩個人的收益情況如下所示：

首先我們考慮A的決策。A會想，我如何才能獲得更大收益呢？如果B坦白了，那麼我坦白就會判8年，我抗拒就會判十年，我應該坦白；如果B抗拒了，我坦白會判0年，我抗拒會判1年，我還是應該坦白。所以最終A會選擇坦白。同樣，B也會這樣想，因此最終納什均衡點在兩個人都坦白，各判八年這裡。

顯然，集體最優解在兩個人都抗拒，這樣一來每個人都判一年就出來了。但是，納什均衡點卻不在這裡。而且，在納什均衡點上，任何一個人都沒有改變自己決策的動力。因為一旦單方面改變決策，那個人的收益就會下降。

這與我國開車夾塞的例子很像。如果大家都不夾塞，是整體的最優解，但是按照納什均衡理論，任何一個司機都會考慮，無論別人是否夾塞，我夾塞都可以使自己的收益變大。於是最終大家都會夾塞，加劇擁堵，反而不如大家都不加塞走的快。

那麼，有沒有辦法使個人最優變成集體最優呢？方法就是共謀。兩個小偷在作案之前可以說好，咱們如果進去了，一定都抗拒。如果你這一次敢反悔，那麼以後道上的人再也不會有人跟你一起了。也就是說，在多次博弈過程中，共謀是可能的。但是如果這個小偷想幹完這一票就走，共謀就是不牢靠的。

在社會領域，共謀是靠法律完成的。大家約定的共謀結論就是法律，如果有人不按照約定做，就會受到法律的懲罰。透過這種方式保證最終決策從個人最優的納什均衡點變為集體最優點。

智豬博弈

智豬博弈是這樣一個例子：有一個食槽中裝有十份食物，但是按鈕在另一端。需要到另一段按一下按鈕食物才能掉下來。大豬和小豬都在食槽一端，他們兩個人都可以跑到另一端按按鈕然後再回來，速度相同，並且都要消耗一定的體力，並且會造成另一隻豬先吃食物。

我們假設每隻豬跑去按按鈕都要消耗2份食物的體力，並且大豬比小豬吃食物快，所以：

如果大豬先吃食物，二者吃食物的比例為9：1

如果小豬先吃食物，二者吃食物的比例為6：4

如果二者同時吃食物，吃食物的比例為7：3

兩隻豬都可以選擇去按按鈕，也可以選擇等待。在考慮了兩隻豬消耗的體力因素後，各種決策對應的收益如下所示：

我們來考慮均衡點。小豬會思考：如果大豬去，我跟著去獲得收益1，我等著獲得收益4，因此我應該等著。如果大豬不去我去，我獲得收益-1，如果我們都等著我收益為0，因此我還是應該等著，這樣一來，小豬的決策一定是等待。

在小豬等待的情況下，如果大豬去按按鈕，獲得收益4，如果大豬不去按按鈕，獲得收益0，因此大豬會選擇去按按鈕。這個（4，4）的收益就是納什均衡點。

這和國家或者公司進行基礎研究研發新產品很像。比如一款新的晶片研發需要花很多錢，成功後也能獲得更大的收益。在這樣的情況下，小國家小公司是沒有動力進行研發的，他們會等待大國大公司研發好了之後，直接利用現成的技術獲得收益。

我們的晶片產業就是這樣一個局面，多年以來我們一直認為自己是發展中國家，沒有大力推動半導體產業的基礎研究，許多人秉著做不如買，買不如租的觀點。現在美國對中國展開貿易戰，禁止晶片出口，一下子就卡主我們的脖子了。

約翰納什是一位傳奇人物，前兩年出車禍去世了。想了解納什的一生，可以去看看電影《美麗心靈》

軒中2017-12-07 22:25:37

納什均衡涉及到非合作博弈，這個事情我可以給你解釋一下，大致就是用離婚這個事情來說吧。

夫妻2個人，要離婚的時候，一般情況下就是要分割財產。這時候，就是一個博弈過程。如果是合作博弈，也就是兩個人好商量，那麼就去協議離婚，民政局領離婚證，財產一人一半，誰也不吃虧。

但是，如果走法院起訴離婚的路線，則是非合作博弈，這個時候要請律師，而且財產分割就會有人吃虧有人佔優勢。

那麼，我們假設夫妻財產是100萬，如果女方請律師，上法院起訴離婚，那麼女方要付出律師費4萬，但可以贏得70萬，男方如果不請律師，那麼男方得到30萬。這個情況下，男方其實是吃虧了。所以，這個不是納什均衡——所謂均衡就是無法再改進了，那麼男方應該怎麼做？當然是要改進，那就請律師，男方付出律師費4萬，這個時候雙方上了法院，最後律師勢均力敵，雙方每人50萬，除了律師費用，每人剩46萬。這個每個46萬就是納什均衡。

所以，從上面的例子可以看出，兩個人不請律師不是納什均衡，因為女方如果知道男方不請律師，她肯定會請律師，最後得到70萬。所以，這個狀態不是一個納什均衡——因為有一方可以透過改進策略多贏錢。最後雙方非合作博弈的納什均衡狀態一定是雙方都請律師，最後誰也不吃虧——律師賺了錢，所以律師在離婚官司裡得到了納什均衡的好處。

張貴傑2018-06-06 20:47:56

股民看過來。

正好結合現在的指數位置的關係，來個大家聊聊博弈論的東西。這個東西，絕對是個好東西，而且是“把人當人”來分析的，主要理論。

納什不是打籃球的那位，而是一位電影原型，也是一位諾貝爾經濟學獎的獲得者，1994年的諾貝爾經濟學獎就給了他。

約翰·納什（John Nash，1928年6月13日—2015年5月23日），著名經濟學家、博弈論創始人、《美麗心靈》男主角原型，前麻省理工學院助教，後任普林斯頓大學數學系教授，主要研究博弈論、微分幾何學和偏微分方程。［1］由於他與另外兩位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻，對博弈論和經濟學產生了重大影響，而獲得1994年諾貝爾經濟學獎。

再來看看納什均衡，先來看定義哈，然後咱再來舉例子。

納什均衡可以分成兩類：“純戰略納什均衡”和“混合戰略納什均衡”。

要說明純戰略納什均衡和混合戰略納什均衡，要先說明純戰略和混合戰略。

所謂純戰略是提供給玩家要如何進行賽局的一個完整的定義。特別地是，純戰略決定在任何一種情況下要做的移動。戰略集合是由玩家能夠施行的純戰略所組成的集合。而混合戰略是對每個純戰略分配一個機率而形成的戰略。混合戰略允許玩家隨機選擇一個純戰略。混合戰略博弈均衡中要用機率計算，因為每一種策略都是隨機的，達到某一機率時，可以實現支付最優。因為機率是連續的，所以即使戰略集合是有限的，也會有無限多個混合戰略。

當然，嚴格來說，每個純戰略都是一個“退化”的混合戰略，某一特定純戰略的機率為 1，其他的則為 0。

故“純戰略納什均衡”，即參與之中的所有玩家都玩純戰略；而相應的“混合戰略納什均衡”，之中至少有一位玩家玩混合戰略。並不是每個賽局都會有純戰略納什均衡，例如“錢幣問題“就只有混合戰略納什均衡，而沒有純戰略納什均衡。不過，還是有許多賽局有純戰略納什均衡（如協調賽局，囚徒困境和獵鹿賽局）。甚至，有些賽局能同時有純戰略和混合戰略均衡。

從股民的角度來說說吧，這也是一個典型的納什均衡的策略問題。所有的參與者都面臨著一個博弈的問題，當一方買入或者賣出的時候，我該怎麼做才能讓我的選擇最優。

這是最經典的，散戶和主力的關係。當主力賣出的時候，散戶跟著賣出是最優的選擇，當主力買入的時候，散戶跟著買入才是最優選擇；而當散戶賣出的時候，主力做買入是最優選擇，散戶買入的時候，主力做賣出才是最優選擇。

當然，對於納什均衡而言，在市場中兩個玩家一種理想的狀態，當有多個玩家的時候，也就是有多個資金參與的時候，博弈就會變得更加複雜一些。

比如說，現在的市場情況，我們簡單的假定有三方，監管層，機構，散戶。監管層的目標和需求非常的明確，不要暴漲暴跌，急漲急跌。那麼機構的需求是什麼呢，在整個去槓桿的背景下，降低資金槓桿，收縮資金，自然要適度的賣出。散戶的訴求又是什麼呢？解套迎來牛市。

管理層出招了，不能漲太快哈，小心特停，也不能跌太快哈，小心視窗指導，電話通知。那麼機構的策略是啥，也就出招了，慢慢賣，不要急於賣出。逢反彈賣，不能把指數砸漏了，偶爾還得抱團取暖維護指數。這是機構的最優策略。那麼散戶呢？最優策略是，跟著機構的思路，反彈跑路。而這裡有相悖的地方，機構的反策略就是吸引散戶接盤，要不賣不出去。

這下能看明白了吧。現在的市場也是典型的博弈策略的選擇。

保持這種憂鬱先生2018-04-23 20:38:30

多個牛逼的人做出的對自己最優的選擇，誰也不想改變。

牛逼的人意思是都足夠聰明，對自己最優選擇，一樣的要考慮到別人的思考，最終誰也不想改變策略了，達到一個平衡，就是納什均衡。

這個可能有均衡，也可能沒有，可能是集體最優解，也可能不是。

所以，納什推翻了亞當斯密的個人最求利益最大化，集體利益就最大化的理論。得若貝爾經濟學獎。

不過現在還是大部分情況下個人在法律範圍內追求利益最大化，社會利益就是最大化。

摺疊歷史2018-04-26 20:09:48

什麼是納什均衡？好問題！

這個改變現代經濟學體系和結構的博弈論概念，確實很多人都非常關注。很多人也像你一樣很想簡單明瞭知道這個概念的內涵。

那就讓科學迷的我用自己親身經歷的一個小故事來分析一下，看看能不能幫大家去掉心中的迷霧。

多年前，我是一個鄉村中學的語文老師兼班主任。

一天，有學生向我反映班裡的男生甲和男生乙兩人在數學考試中傳遞紙條，夥同作弊。我在比對兩人的試卷後，確實發現雷同的地方比較多，但是沒有實錘，不好給兩人定性作弊。

於是我把甲、乙兩人各關在一個教師辦公室，分別對兩人說，如果兩個人都坦白自己作弊的經過，就數學成績都扣30分；如果一人坦白，一人抵賴，作弊的事情坐實後，抵賴的人數學0分處理，坦白的人扣15分。然後，我遞給兩人各紙一張，筆一支，讓他們自己作出選擇。

兩位學生面臨的處境，就是博弈學中所說的囚徒困境。

朋友們，作為旁觀者，你來幫我的兩位學生分析一下，什麼樣的選擇才是最好的選擇？

對！

對兩人來說，最好的選擇就是兩人都不承認自己作弊，這樣，我依然沒有實錘，不好定性作弊。兩人的數學成績就不會被扣掉分數。這種選擇，在經濟學上叫

帕累托最優

。

但實際上，兩人在做選擇時，往往都會想：如果我死不承認，但是對方坦白了，那不是我的數學成績要成0分了？怎麼才能保證對方不會坦白呢？

所以兩人思來想去，往往最後的結果是各自坦白了作弊經過。

他們的這種各自坦白，接受被扣30分的選擇，我們在經濟學上就稱之為“納什均衡”

。在經濟學概念上，和納什均衡對應的，就是靜態的帕累托最優。

這樣說你明白了嗎？

當然，經濟生產中的博弈比我兩位學生之間的博弈要複雜上百倍，但是實質是一樣的，都是一種非合作性博弈狀態。

你可以把學生的人數變多，變成五個、十個。然後把你自己置身其中，你也是其中一個，你想要矢口否認作弊，但是你自己一人否認無效。所以你最好的策略選擇就是不改變自己原來要坦白承認的選擇。

在商業競爭中，這樣類似的選擇很多。你想要改變策略，想要得到好的商議回報。但前提是所有和你一起參與博弈的人都要和你一起改變策略。這樣，博弈的結果往往是大家都不願意改變現狀，也就是一直處在“納什均衡”狀態。

最後說說納什均衡對現代經濟學的意義。

納什均衡”對亞當·斯密的“看不見的手”提出挑戰：按照斯密的理論，在市場經濟中，每一個人都從利己的目的出發，而最終全社會達到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個悖論：從利己目的出發，結果損人不利己，既不利己也不利他。

”納什均衡的重要影響可以概括為以下六個方面：1．改變了經濟學的體系和結構。2．擴充套件了經濟學研究經濟問題的範圍。3．加強了經濟學研究的深度。4．形成了基於經典博弈的研究正規化體系。5．擴大和加強了經濟學與其他社會科學、自然科學的聯絡。6．改變了經濟學的語言和表達方法。

文字工作室2018-04-29 22:31:35

市場上有2家企業A和B，都是賣紙的，紙的成本都是2元錢，A和B都賣5塊錢。

有一天A降價到4塊錢，於是A銷量大增，B銷量大減。B看到了後，降價到3塊錢，於是B銷量大增，A銷量大減。

但如果價格戰一直這樣打下去，對誰也沒有好處，於是A也選擇降價到3塊錢，和B一樣。B看到了A降價到3塊錢，B既不敢漲價，也不敢降價。漲價了市場就丟了，降價了，就賺不到錢甚至賠錢。所以A和B都不會再去做改變，這就是納什均衡。

A和B怎樣能夠獲得最大利潤呢，就是A和B坐到一起商量，同時把價格提高，這就叫共謀，但法律為了保障消費者利益，禁止共謀。

所以有的企業會打出這樣的橫幅“我的價格一定不會比B低”，B是指競爭對手。意思是告訴對方，我會和你用同樣的價格，所以你儘管定高價。顯然這樣的橫幅也是共謀，也是違法的。

閒話經濟2018-04-25 11:30:56

納什均衡是博弈論的最基礎，最重要重要的概念。也是博弈論初學者最先接觸的概念，最早理解的均衡。

講納什均衡可以不用數學，不用模型，但至少要用圖表。不過用圖表的話，看起來太枯燥。閒話經濟力圖提供簡單易懂的經濟觀點，這裡試著用文字簡要介紹一下。

納什均衡兩個基本假設。一是人是完全自利的，完全從自我利益出發考慮行動策略，爭取最有利的決策。二是資訊是不對稱的，博弈參與人不知道對方會選擇哪一個策略，如果彼此知道對方選擇什麼，納什均衡可能不存在。

基於以上兩個假設，博弈參與人只有在可選策略中選擇對自己最有利的策略，而不考慮對方選擇什麼。簡單地說，你有你的千條計，我有我的老主義，反正我只幹我最有利的事情。

參與人都這麼想，最終進去博弈方都不在改變策略的均衡狀態，即納什均衡。在納什均衡狀態下，博弈方都認為自己有利的策略，不在改變策略。

事實上納什均衡狀態下，每個人選擇最有利的策略並非結果對自己最有利。因為私心，最終偏離了共贏，進去多損狀態。

不足之處，請批評指正。

華立人2018-04-23 20:00:36

只用文字而不用數學形式來解釋納什均衡將是一項挑戰。

對於完全資訊靜態博弈，即所有參與者的策略對所有人來說是共同的知識，且每個參與者在參與博弈前就選定好了策略並且不改變。如此，對於博弈中的每一個參與者，ta在假設其他所有參與者選擇了各自最優策略的基礎上選擇出自己的最優策略，所有參與者的最優策略集便是一個納什均衡。

簡單來說，博弈中所有人都儘可能使自己的收益最大化，當達到納什均衡時，單獨的任何一人不論如何改變，ta想要再獲得更高的收益的行動都將是徒勞的。

通常講博弈論時都會用囚徒困境的例子，在此不展開了，這是一個純策略的完全資訊靜態博弈。此外還有混合策略的完全資訊靜態博弈，要稍微複雜一些。可將納什均衡從最優純策略集擴充套件到最優混合策略集，比如猜拳。

再複雜一些的博弈包括不完全資訊靜態博弈、完全資訊動態博弈、不完全資訊動態博弈，其中的納什均衡概念也更復雜（我也還在學習中）。

對此感興趣的話，推薦一本教科書《博弈論基礎》（吉本斯著）

快招了吧你就是狐狸2018-04-24 15:07:10

很多人都講的很清楚了，我還是給你講簡單點吧：

兩個聰明的競爭的對手鬥心眼，鬥到誰都不能再做新的計劃了，任何新計劃的結果都是失去更多利益了，那這個狀態就叫納什均衡。

重點是鬥心眼，而不是真的去打100個回合之類。

Dr_J2018-05-04 10:15:00

扯那麼多例子廢話幹嘛，直接從定義解釋。。當多人博弈，每個人都從各自的策略集合中選定了一個策略

時，納什均衡指的是如下狀態：對每一個人來說，當其他所有人的策略給定是當前策略時，這個人目前的策略是他自己的策略集合中最好的那個。也就是說處於納什均衡狀態時，沒有任何人願意率先改變自己目前的策略，系統處於某種意義上的穩定態。

小蜜蜂問答

小蜜蜂問答

誰能把納什均衡給講清楚點？

推薦文章

小蜜蜂問答

小蜜蜂問答

誰能把納什均衡給講清楚點？

相關文章

什麼是旅行社產品銷售策略

求太陽13納什的完全資料（超詳細）！！

凸最佳化學習系列(Stephen Boyd)--第一章(Introduction)

愛吃的東西少吃些，對還是不對？

推薦文章