MyOOPS開放式課程
請加入會員以使用更多個人化功能
來自全球頂尖大學的開放式課程,現在由世界各國的數千名義工志工為您翻譯成中文。請免費享用!
課程來源:yale
     

 

 

 [耶魯開放式課程] Ben Polak 教授指導之賽局理論

Game Theory with Professor Ben Polak

講座1簡介:五個首先要明確的規則

講座2-換位思考

講座3-迭代剔除及中間選民定理

講座4-在足球運動及商業夥伴關係中的最佳對策 

講座5-納許均衡:劣勢潮流及銀行擠兌 

講座6-納許均衡:約會策略和庫諾模型 

 

Photo of three lions hunting on the Serengeti.

講者:Ben Polak

 

翻譯:YYeTs人人影視

編輯:洪曉慧

簡繁轉換:洪曉慧

後制:洪曉慧

字幕影片後制:謝旻均

 

關於這門課程

這門課程系統化地介紹了有關賽局理論和策略思想。例如支配思想、落後的感應、納許均衡、進化穩定性、承諾,信譽,資訊不對稱,逆向選擇等。並在課堂上提供了各種遊戲以及經濟、政治、電影和其他方面的案例來討論。檢視課程表 >>

 

課程結構:

本耶魯大學課程每週在學校上兩次課,每次75分鐘,2007年秋季拍攝作為耶魯大學開放課程之一。

 

關於Ben Polak 教授

Ben Polak教授任職於耶魯大學管理學院經濟系。他在劍橋大學三一學院獲得學士學位,在西北大學獲得碩士學位,在哈佛大學獲得博士學位。他是微觀經濟理論和經濟史方面的專家。他的論文在《Eonomic Letters》、《經濟理論期刊》、《經濟歷史期刊》、《法學研究期刊》、《經濟理論及制度期刊》、《Econometrica》等學術期刊多次發表。他最近的研究是「廣義功利主義和海薩尼的公正觀察員定理」和「平均分散的偏好」。

 

講座1-簡介:五個首先要明確的規則

 

 

第一講概述:

我們藉由遊戲來闡述賽局理論。將遊戲以玩家、他們的戰略、目標或收益組織起來,學習應該先決定我們的目標是什麼,然後才作出選擇。在囚徒困境賽局中,我們討論了某些可能收益。我們學習到,永遠不應選擇劣勢策略;但理性玩家的理性選擇會導致糟糕的結果。我們討論了一些現實世界中的囚徒困境,和一些現實世界中可能的補救措施。在協調問題賽局中,因不同收益考量,產生非常不同的結果,而討論了其他可能收益。我們需經常思考,不僅是自己的收益,還有他人的收益。我們應該換位思考,並嘗試預測他人將會怎麼做。這是策略思考的重點。

 

閱讀作業:

杜塔著《策略與賽局:理論與實務》第一章,1-3 節

喬爾•沃森著《策略:賽局理論簡介》第一章

 

資源:

第一講總結 [PDF]

第一講黑板筆記 [PDF]

 

講座1-簡介:五個首先要明確的規則

 

2007年9月5日

 

Ben Polak 教授:歡迎來到經濟學159 賽局理論,如果你是來上藝術史的,那你走錯教室了,不過你不妨留下來,沒準你會喜歡這門課。這裡是賽局理論,你們每人都應該有四頁講義,人手一份,裡面有一張授權書,是關於視頻採集的,我們一會再說這個。有一張初步教學大綱,網站上也有。有兩頁分別印有遊戲1和遊戲2的傳單,大家先瀏覽一下遊戲1,然後思考一下,你們一邊思考一邊聽我說。我來簡單介紹一下這門課程。還有這門課程的評分細則,請大家看一下遊戲1,我知道有人沒看,他們用那張紙扇風呢!快瀏覽一下遊戲1,然後填完,好嗎?

 

你們一邊寫一邊聽我說。我來簡單地介紹一下這門課,什麼是賽局理論?賽局理論研究策略形勢。那什麼是策略形勢呢?我們先看看什麼不屬於策略形勢。在你們經濟學基礎課115或者110中,應該講過一些不是策略形勢的案例,比如說自由競爭企業。這些企業是價格接受者,他們不必擔心他們的競爭對手的策略。又比如說壟斷企業,壟斷企業沒有競爭對手,所以這也不是策略形勢,他們不是價格接受者。但面對需求曲線,對於你們這些學過經濟學115的來說,這些聽起來都不陌生吧!介於這兩種情況之間的就是策略形勢,也就是說,不完全競爭的情況,就是策略形勢,比如汽車產業。在汽車產業裡,福特關注通用和豐田的決策,現在可能暫時還得關注克萊斯勒的決策。少數幾家公司的決策會互相影響,策略形勢書面定義是行為影響結果,然而結果不僅取決於你的行為,還取決於其他人的行為。好了,暫時就先介紹這麼多。透過學習本學期的課程,你們會接觸更多類似案例,下面我們講講賽局理論適用於什麼領域。

 

顯然適用於經濟學,但也適用於政治學。實際上,對政治專業的同學來說,它也算作政治課。回去諮詢一下本科教學主管,確實算的。近年來賽局理論在法學上也舉足輕重,我估計你們多數人可能會去讀法學院,賽局理論對你們來說是門不錯的基礎課。賽局理論同樣適用於生物學,在本學期期中的時候,我們會探討一下賽局理論應用於生物進化理論的案例。而且毫不奇怪,賽局理論適用於體育。

 

我們接下來談談評分標準。這兩個遊戲你們填好了沒有?每個人都要學會一心多用啊!還在填遊戲1,好吧,繼續填。我們繼續講評分標準,不過我得先介紹一下教室裡的大傢伙。有些人注意到了這幾位攝影人員,可能你們已經知道了,耶魯大學正在開展一個教育專案,我們在錄製一些課程的錄影。這樣做的目的是讓耶魯外的人也能享受到這些教學資源。課程將被發佈到網路上,全球各地的人都能看到,比如美國人,或者更遙遠的國度,像廷巴克圖。他們可能在當地大學不容易得到這樣的教育資源,他們就可以到耶魯網站觀看這些視頻。

 

有些同學可能之前參加過這種課程,這門課的不同之處在於,大家都要參與到課程中來。課堂上我們透過做遊戲來賽局,課上會有隨堂討論,課堂交流。我們相互學習,這樣看視頻的學生也能收到良好的教學效果,但同時這意味著你要被拍到視頻中來,至少也會被錄音。

 

課程怎麼拍攝呢?教室裡有三位助教持有麥克風,我來告訴大家助教坐在哪裡。當我們進行隨堂討論時,我會請一位助教拿著麥克風到你那,就像多納休那樣。有時候你會被拍攝到,此時攝影機會轉到你所在的方向。

 

我希望大家多多配合,我來解釋一下我的理由。我覺得這門課不應該僅僅由我來講。沒錯,我是課程的一部分,但你們也要參與到課堂中來。但是這會有個條件,你們都要簽署授權書。

 

你們的面前應該有張授權書,授權書的大概內容是允許我們把你拍攝進來。大家考慮好,日後你要是在視頻裡發現你糟糕的髮型,可別起訴耶魯大學。被FBI通緝的,簽證失效的,還有前女友就坐在旁邊的,趕快找個紙袋子把臉給蒙上。

 

還要說一下,每節課我們都會看到這兩名工作人員。裘德是攝影師,大家跟裘德打個招呼。這位就是裘德,韋斯是錄音師。我會儘量注意不要讓他們兩位加入課堂討論的,但是你們也要注意到他們的存在。要是這令你很緊張,它會讓我更緊張,這權當安慰了吧!

 

我會儘量讓課堂順利地進行下去。還有一件事讓我說完。沒有人會從中得到好處,雖然我也希望他們會得到酬勞,但至少我和助教們是沒有酬勞的。這完全出於好意,這是個教育項目,我也希望你們也能盡己所能把它做好。還有希望大家都能相互理解一下,當我們舉行課堂討論的時候,請你們靠前站出來一點,這樣便於裘德拍攝。

 

言歸正傳,你們填好了沒?各位是否都填好第一個遊戲了?還沒有,那我們多介紹一下評分標準。我猜你們最關心的應該是成績了,那麼這門課是怎麼評分的呢?課堂作業占總分數的30%,期中考試占30%,期末考試占40%,即30/30/40。

 

期中考試在十月十七日,教學大綱上也寫了,所以以後千萬別跟我說,你不知道什麼時候期中考試,然後還在考試那天安排大一堆事去做。期中考試在十月十七號週三,隨堂舉行。關於課堂作業,我應該會安排十次左右的課堂作業,在留作業的時候我再細說。週一留第一份作業,十天之內交上來。差不多每週都有課堂作業。

 

有關分數的分佈,我介紹一下大體的分數的分佈。總體來說,六分之一的人會得到A,六分之一的人會得到A-,六分之一的人會得到B+,六分之一的人會得到B,六分之一的人會得到B-,剩一下的六分之一,如果我沒算錯,這些人將會得到傳說中的「超優」成績。

 

但我可能稍微壓縮一下分數段,我會讓分數段更有彈性。實際上略少於六分之一的人會得到A,略少於六分之一會得到C。我們這樣壓縮會使更多的人得到B,不過從教學經驗看,中間成績應該是B+,分數中位數會在B+的附近。稍微提示一下忘記中位數含義的同學,這也就是說,不是一半左右,是絕對一半的同學會得到B+的成績,或更低的成績,另一半會到B+的成績,或更高的成績。

 

那兩張表你們填得怎麼樣了?每個人都填好了嗎?應該差不多每個人都填好了吧!在我把表收回之前,我再講最後一件事,課本。這門課的課本主要是這本,杜塔的《策略與賽局》。要是你想要一本更難更有挑戰的,試試喬爾•沃森的《策略》,這兩本書在書店都有賣的。

 

不過我先提個醒,我不會完全參照課本,課本只不過是救命稻草。要是你課堂上沒聽懂,或者你課後想深入瞭解一下課上的內容,你應該去讀書上對應的章節。教學大綱會告訴你每堂課講哪章,或者每週講哪幾章,但是我不會嚴格按照課本來講課。重申一下,課本是救命稻草。

 

對了,我強烈建議讀一讀《戰略思想》,這是本不錯的睡前讀物。你們失眠嗎?你要是失眠它絕對是最好的睡前讀物。這也的確是本好書,而且今年會有新版上市。出版商會讓我們提前得到新版的。如果你這周不買,可能下周你們就能買到新版的了。我不會從中得到抽成,這不是推銷。

 

小組討論的安排在教學大綱上,哦,我說錯了,像平常一樣在網上註冊。如果你想換個小組,請在等候名錄裡預約,一般你只需要預約一次就可以了。你們現在應該填完了吧!都填完了嗎?我們把表交給助教吧!讓他們來幫我收一下遊戲1,不要遊戲2,只要遊戲1。

 

收表的時候,我來說說這門課的名聲。你們要是在網站上看了教學評估,就會發現這門課有點難,但也很有趣,我也希望這門課是這樣的。你要是認為這門課挺簡單,這不是輕鬆的課,事實上它有點難。我保證這門課一定很有趣。為什麼這門課很有趣?因為學習賽局理論,大家安靜一下,在課堂上我們透過一些遊戲來學習賽局,我們不剛做完一個遊戲嗎?這是第一個遊戲,整個課程充滿了遊戲。有時候一周做幾次,有時一週一次。

 

表收齊了嗎?每個人都交了吧?下面要開始統計了。有人上過會計課嗎?有人想幫忙統計嗎?這有一個人想,我還是安排助教做吧!卡茄你幫我統計一下好嗎?我們回顧一下剛才進行的遊戲。

 

遊戲1是一個簡單的成績賽局,請仔細閱讀以下條款。在不被你同桌看到的情況一下,在方框中填寫字母α或者字母β,把這看成成績的賭注。我會隨機把你們分成兩兩一組,你們不知道會跟誰分到一組,按如下方法給出你們的成績。純屬娛樂,大家別當真。如果你選α而你對手選β,那麼你得A你對手得C。如果你們都選α,那麼你們都得B-。如果你選β你對手選α,你得C你對手得A。如果你們都選β,你們都得B+。

 

這就是你們之前填的東西。

 

在我們討論之前,先有效地整理一下這些資訊。我先把它們擦掉,一會再開始分析。我們先記錄一下這個遊戲的內容,就是我們的成績賽局。因為這麼長一段文字,從中摘取資訊有點困難,不如我們列表整理資訊。那麼我把我寫在這裡。我的對手,就是被隨機分到的人寫在這,還有是α和β,就是我要做的選擇。還有我對手要做的選擇。

 

我把我的成績填到表格裡。如果我們都選α,我得B-;都選β,我得B+。如果我選α她選β,我得A。如果我選β她選α,那麼我得C。這些都對吧?好了,我們再把對手的情況也寫下來。我的成績寫在左邊的表格裡。我們再看看我對手,她會得到什麼成績?

 

提醒一下坐在後面的人,我的板書寫得很糟,所以最好往前坐。還有我得檢討的是我的口音,我會努力寫好板書,但是口音暫時不太好改。

 

如果我們都選α,我對手得B-;如果我們都選β,我們都會得到B+。此情況下,我對手得B+。如果我選α我對手選β,那麼她得C;如果我選β她選α,那麼她得A。由此我就把這張紙上的所有資訊都包含進來了。

 

下面再用賽局理論的標準方式來整理資訊。從今天以後大家要習慣用這種標準,與其畫兩個不同的表格,不如把第二個表格的內容插入到第一個表中。我來做個示範,你就明白我的意思了。我要畫個結構相同的大表格,用列來表示我選α還是β,用行來表示我對手選α還是β,但我要把兩人成績寫在一個單格裡,這樣就更直觀了。如果我們都選α的話得B-;如果我們都選β的話得B+;要是我選α我對手選β,我得A 她得C;如果我選β她選α,我得C而她得A。

 

注意一下我的表示方法。單格內第一個成績是我的成績,每個單格第二個成績是我對手的成績,這樣就把前兩張表格的資訊更簡明地表述出來了。它是一個列出了賽局所有內容的矩陣。

 

現在我們來考慮一下我們的選擇。我們舉手表決吧!多少人選了α?先不要放下手,讓裘德拍一下,這樣看視頻的人也能看到。多少人選了β?遠遠少於選α的,先不要放下手,這裡有一個選β的。我們來數一下,確認一下,選α的人要遠遠多於選β。我們來探討一下你們為什麼這麼選。

 

來看看都誰選α了?穿紅色衣服的女士,遞給她一個麥克風,請問沒被FBI通緝吧?你選了α對吧?你為什麼要選α呢?

 

學生:我感覺我對手會選α,因此我也選α。

 

教授:這麼說你也寫下了這些矩陣,你分析出了對手的選擇,並依此做出的選擇。還有別的原因使你們選α嗎?把麥克風遞給那位女士好嗎?它們只不過是麥克風而已,別緊張。

 

學生:我選α,是因為不管我對手選什麼,我選α得到的成績總會比選β的要好。

 

教授:請問你叫什麼名字?

 

學生:考特尼

 

教授:考特尼,另一位女士的名字是?

 

學生:克萊拉•埃莉斯。

 

教授:克萊拉•埃莉斯。雖然原因不盡相同,但她們都選了α。克萊拉•埃莉斯的理由是,她怎麼說?她說無論別人怎麼選,她覺得選α會使自己得到最優的結果。先保留這個說法,我們稍後再做討論。這是克萊拉•埃莉斯的理由,我們一會再討論這個理由。我們先來討論一下選β的理由。我要強調一下,這裡沒有錯誤的答案,在以後在課上可能會有錯誤的答案,但是現在沒有錯誤的答案。有不充分的理由,但沒有錯誤的理由。請選β的再舉一下手,看看有誰選了β?之前這裡有選β的啊!你選過β對嗎?哦,你改變主意了。能不能把麥克風給一位選了β的同學?我們往走道這邊來一點,那有人選β對嗎?你是不是選了β?這邊有人選β的嗎?能把麥克風拿到那裡嗎?這有一個選β的,先別放下手。對了,把麥克風對著他,請講。

 

學生:為什麼選β,對嗎?

 

教授:沒錯,繼續說。

 

學生:我不喜歡成績波動很大的,比如B-/B+這個範圍,所以我還是喜歡像A到C這樣小一點的,這就是我的原因。

 

教授:你說的意思是壓縮範圍,但是我不太確定這是否壓縮了範圍,要是你選α,你的分數會在A到B-;選β,分數範圍會在B+到C,這兩個範圍大小差不多,但這也算是個原因,還有別的原因嗎?好的,穿藍色衣服的小夥子,沒錯,就是你,不要拿走麥克風,對著它說就可以的。

 

學生:我覺得我們本可以團結合作的,但是我看在這個賽局中不行,所以我選了β。

 

教授:抱歉,剛才警報響了,我沒太聽清楚,站起來再回答一下好嗎?

 

好的,我叫特拉維斯,我本想讓大家合作的,但實際不行。

 

教授:很好,這確實是個不錯的理由。

 

學生:如果大家都選β,都能得B+,但不太可行。

 

教授:特拉維斯給出了不同的理由。他說或許你們中的有些人會在意其他人的成績,你們互相都很熟悉,你們來自同一個學院,假如我們要在商學院進行這個賽局,這裡有念MBA的嗎?有一兩個,要是我們在商學院進行這個賽局,我覺得會有很多人選α;但是我們要是在神學院做此賽局,我猜特拉維斯的回答反映了你們的理由。如果我們在神學院做這個遊戲,你們都同意吧!神學院的學生會在意別人的成績,對嗎?那就涉及到道德的因素了。人們出於道德的原因可能會選β,應該還有其他的原因,但這個原因值得我們注意。我希望大家從中發現,這並不是真正意義上的賽局,目前我們涉及行為、策略、局中人,而且我們知道不同的結果,但是我們忽略了一個賽局必備的因素。我們忽略了什麼?

 

學生:動機。

 

教授:我們忽略了動機,我們忽略了收益,我們忽略了局中人關心什麼,只有明白人們關心什麼,知道人們的收益是什麼之後,我們才能真正開始分析這個賽局。這裡我們要解釋一下,我差點就忘記說了。

 

賽局理論,還有我,耶魯大學教授,無法說出你的收益應該是什麼樣的,我也不能告訴你你人生目標應該是什麼,這不是賽局理論能解決的。然而一旦你知道了個人的收益,一旦你確立了目標,賽局理論能幫助你達成目標。

 

我們現在有兩種不同的收益,一種是只在意自己的收益,另一種像特拉維斯提到的,在意其他人的收益,接下來我們分別用不同收益來分析一下這個賽局。我們先寫出來這個賽局可能的收益,我們一會再來討論另一個收益,神學院的稍後再討論。

 

我們首先討論我和我對手選擇α或β的矩陣,不過這次我們用數字來表述。有些人可能事先見過這些數字,但現在這都無關緊要。為什麼要引入數字呢?首先,這些數字代表了效用,或者說功利,他們代表了人們想要最大化的東西,和想要達成的目標。

 

和那個結果矩陣相比,這樣能更直觀顯示收益。比如說(A,C)這個單格,(A,C)代表了3單位效用,而(B-,B-)代表0單位效用,以此類推,這表示什麼意思呢?首先,大家一下都能想到的是,有這樣的動機的人,他們只在乎自己的成績,他們覺得A就是比B+要好,B+比B-好,B-也比C好,我希望我成績儘量好,要不我一年的努力就白費了,所以這些人關心自己的成績,他們只關心自己的成績。

 

我們把這種人叫什麼呢?有沒有適合稱呼他們的術語?在英格蘭,我們把這種人叫自私鬼,不知道這算不算術語,可能他們一點也不講道德。那我們再問個問題,不管這是不是真的,就是你們收益,假設這就是你們的收益,現在這就是你們的收益了,我們不討論你做了些什麼,而討論你應該怎麼做,由此我們就把它轉化成了一個名義問題。你應該怎麼做?我們回顧一下克萊拉•埃莉斯的觀點,我們再把麥克風遞給她,請再解釋一下你的選擇及其原因。

 

學生:我為什麼選α嗎?

 

教授:沒錯,請站起來回答一下,別緊張。

 

學生:Okay

 

教授:你選擇的是α,我想這差不多就是你的收益了吧?你關注自己的成績?

 

學生:是的,我在想-

 

教授:那你為什麼選α呢?

 

學生:嗯?

 

教授:你不是選了α嗎?請再重複一下理由。

 

學生:因為我發現,如果我選α的話,我得到的兩種結果是最優的。

 

教授:克萊拉•埃莉斯得意思是,要是我轉達的不對請提示我,不管別人怎麼選,不管她對手選了什麼,她選α總會得到最優的成績。我們來驗證一下,如果對手選α她也選α,她得到0,對手選α她選β,她得到-1,0比-1大吧?如果她對手選β,她選α得到3,她選β得到1, 3也比1大,這兩種情況下,無論別人怎麼選,她選α總能得到更好的成績,所以她應該選α。大家都跟上這個思路了嗎?這個理由比我們之前的那些更有說服力。我忘記剛才那位女士的名字了,穿紅色襯衫的那位。

 

學生:考特尼

 

教授:她叫考特尼。對,考特尼也說了她為什麼選α,她也有不錯的理由來選α,這本身沒錯,但是呢?這個理由顯得更充分,而你的理由有點隱晦。

 

所以我們做一下定義,我覺得這裡能寫下,那就寫這裡了。

 

定義:如果選α得到的結果嚴格優於β,那麼α相對於β是個嚴格優勢策略。注意此定義的重點在,無論別人選什麼。

 

我們再來看一遍,無論別人怎麼選,如果選α得到的結果嚴格優於β,那麼α相對於β是個嚴格優勢策略。這節課的目的不是為了教大家術語,不過稍微懂一點術語會讓交流更順暢。這個定義當然算術語,「自私鬼」應該也算個術語吧?

 

讓我們從中總結點經驗教訓。你們可以繼續看看那句話,我先把這塊黑板擦一下。這節課的第一個結論,以後我們會總結更多的結論,從嚴格優勢賽局概念裡總結出來的結論是這樣的,本節課的第一個結論:不要選擇嚴格劣勢策略。斯特倫克和懷特很抱歉,用了被動式,即劣勢,被動語態,不要選擇嚴格劣勢策略。誰能告訴我為什麼不能這麼做?把麥克風遞給這個小夥子,請起立。

 

學生:因為每個人都會選擇優勢策略,而導致結果變糟,使總結果變的更糟。

 

教授:這是個合理的答案,我想要一個更直接的回答。我們來看看什麼是嚴格劣勢策略?我說了絕對不要選它,為什麼呢?把麥克風給那位女士好嗎?

 

學生:「你永遠不會贏」。

 

教授:好吧,我不確定這是不是關乎輸贏。還有別的答案嗎?穿粉色上衣的男生呢?

 

學生:回報較低。

 

教授:回報較低,我有一個比較簡約的說法,我是說可能有點長,我不選擇嚴格劣勢策略的原因是,要是我選了優勢策略,我在每次賽局都得到更好的收益,為什麼我不選擇嚴格劣勢策略?因為我要是選優勢策略,不管別人怎麼選,我總得到更好的結果,這聽起來是個充分的理由,這有點令人信服,這個道理太明瞭,甚至不值得討論。那我們來看看到底是不是這樣的。

 

難道你就是被FBI懸賞的傢伙?

 

那我們再來看看這個說法。再看看那個矩陣,我能不能這麼說,假如我和我隊友都這麼想,如果我們都選α,我們得到0單位效用,但是如果我們都換個想法去選β,那我們就都得到1單位效用,因此我該選β,1比0大,我應該選β,這個說法有什麼問題?這個說法肯定有問題,因為這和我們的結論剛好背道而馳,結論是絕對正確的。結論沒錯,那這個說法錯在哪?艾爾?

 

學生:因為你必須要能夠達成一致,你需要和他們談判,但是我們不允許同伴看到我的選擇。

 

教授:很好,那需要達成一致,那麼說問題就出在這裡,就是之前我們說應該選β的問題。如果我們要都這麼想,確實得到更好成績,但這是有前提的。這就好像是在說,要是我這麼推理然後選了β,我有辦法讓你們也都用同樣的方式推理,好像我有超能力或者我是X-Men,是叫X-Men吧?事實上,這絕對是不可能的,我沒有超能力,我也不是X-Men,所以你根本看不到我大腦發出的腦波,我的推理不會影響到你,所以就算我這麼推理了,我選了β,但這些不會影響你的選擇和你的推理,這就是那個推理的漏洞之一。那個推理還有別的錯誤沒?那個男生。

 

學生:第二個錯誤,如果你選了β,那麼別人就會從中攫取到好處。

 

教授:這樣有人就會從我身上得到好處。這還不夠,我需要更充分的理由。這說得對,但我要個更充分的理由。這麼說吧?就算我是X-Men或者尼奧,我能影響到別人的推理,就算我能用我腦波強迫你們選β,那我應該選什麼?我應該選α。如果我關心我成績,我應該直接選α,因為那樣我能得到3單位效用,這是這個說法的第二個漏洞。第一,它建立在超現實的假設上,即我的推理能影響到你們,這在地球上是不可能的。第二,就算以上條件可行,我仍應該選α。

 

但畢竟我剛才說的有點道理,它確實有點道理,不然那個說法也不會聽起來像是對的,這一點是正確的。的確,如果我們都選α,我們都得B-,我們的收益是0單位效用,而不是1單位。如果我們都不去選擇劣勢策略β,我們的收益就是次優的收益。

 

我們從中總結出第二個結論。結論二,要不是經濟學近一個世紀來講的是相反的道理,這個結論都不值得一提。理性的選擇,即本案例中人們不去選擇劣勢策略,反而選擇優勢策略,使總結果變得,美國人怎麼說的?「糟糕」。要是想說的更專業點,記不記得在經濟學115裡面說的,會導致「不充分的」結果,即「帕雷托效應」,但我們今天說「糟糕」就可以了。理性人的理性選擇造成了次優的結果。

 

有一個著名案例,它是這個推理的不錯解讀,有人知道案例的名字嗎?就是囚徒困境。有人之前聽過囚徒困境嗎?你們都學過經濟學115,為什麼稱為囚徒困境?穿橘色衣服的男生,沒關係,他能錄到你。

 

學生:我記得是,兩個囚犯面對審判的時候有如下選擇,如果他們中有人供出了對方,他會減刑,要是他們都供出了對方就要受重刑。

 

教授:在故事裡有兩個罪犯,他們都被指控了,被分別關進了牢房,他們倆被單獨提審。兩人都知道,如果他們不坦白,他們都要只需要坐一年牢,要是都坦白了,兩人都要坐兩年牢,要是你坦白而他不坦白,你無罪釋放而他坐五年牢。先放下手裡的事,快速思考一下,不管那個傢伙是不是坦白了,你最好要坦白。

 

如果你之前沒聽說過囚徒困境,回去看看每天晚上演的《法律與秩序》。你沒看過《法律與秩序》嗎?你要是沒看過,隨便去找個電視機,在任意時段任意頻道都能看到,每集都有類似的劇情。如此,以至於,我的意思是在耶魯大學,如果你或者電臺的人,要是你們想要寫劇本,讓他們來上這門課或者回家看視頻,這很能啟發他的靈感。

 

當然,這可不是唯一的案例,成績賽局和這個並不是僅有的案例,囚徒困境的案例有很多,我們再來看看其他的案例。你們有多少人住宿舍?有多少人有室友啊?差不多都有,是吧?我在想,我就不叫你們舉手了,這挺尷尬的。到期末或者年末的時候,你們宿舍衛生怎麼樣?

 

我看啊,因為我也念過大學,期末或年末的時候,耶魯大學多數宿舍會挺髒亂的。為什麼會很髒亂啊?因為沒人打掃啊!誰都不願意清理吃剩的比薩、乳酪渣、還有麵包渣。為什麼你們不打掃啊?

 

我們來分析一下到底有什麼問題。你們指望別人去打掃環境,對不對?讓別人去打掃環境是你最希望的結果,你為大家打掃環境是你最不希望的結果,現在想明白了吧?這就是囚徒困境。如果別人不打掃,你最好也別打掃,因為你最不想幹的事,就是為別人打掃環境。要是別人打掃完了,屋子乾淨了,我賺了,最後誰都不去打掃宿舍,宿舍當然就髒了。

 

我說對了沒?你們宿舍很乾淨嗎?這麼隱私的話題我們就不討論了。生活中不乏囚徒困境的案例,還有別的案例嗎?抱歉,我沒太聽清楚,給他一個麥克風,這樣大家都能聽到。

 

學生:離婚糾紛

 

教授:哦,離婚糾紛,你才這麼小就開始想這些了。不過這確實是個好案例。好的,找律師,武裝衝突,有沒有經濟學案例啊?企業打價格戰是不是?每個企業都有削弱對手的動機,最後他們的利潤都下降了。你最不想看到別的企業透過降價來打壓你,這對消費者來說是有利的,但對企業和行業的利潤是不利的。我們怎麼解決這個問題?我們在以後會繼續講,大家先有個印象,在現實中我們怎麼化解囚徒困境?怎麼化解啊?這個男生你來回答一下。

 

學生:串通。

 

教授:串通,企業可以串通好。那他們為什麼不能串通?他們或許可以簽訂一個合同,可以協定好你不降價我就不降,然後可以找個剛處理完離婚糾紛的著名律師來作見證人,那樣他們就放心對方不會打價格戰了。是這樣嗎?為什麼這麼做不行?為什麼他們不能簽這樣的合同?為那是違法的。這是個無效合同。那你和你室友是不是可以簽協議?有人寫過協議嗎?在冰箱上貼個磁力貼,規定好什麼時候該誰打掃房間?幾乎沒有吧!為什麼即便沒有書面合同,你一樣可以和你室友合作得愉快。

 

學生:它不具有法律強制性。

 

教授:事實上,它具有法律強制性。這個男生說沒有,但它確實有,你們可以寫個書面協議。請那位女士回答。

 

學生:重複,你一遍又一遍地重複。

 

教授:沒錯,就算你和室友沒有書面協議,你們一樣能達到預期的目的。因為在耶魯大學上學期間,你們總要碰面,我們以後再繼續探討為什麼重複能夠促成合作,我們在後半學期再探討這個問題,那是以後的內容,但我們會學到的。

 

剛才有一個人提到過溝通,我記得是坐在前面的,我們回來想想,溝通是個原因嗎?人們之所以取得糟糕的結果,我不敢說結果是不是真的不好,但人們選α是因為不能交流嗎?假設你們交上來之前約好了,比如這位女士,叫什麼來著?

 

學生:瑪麗

 

教授:她跟旁邊的男生約好,他叫…

 

學生:艾瑞克

 

教授:他倆這麼商量的:咱倆會被分到一組,你要是選β我也選β,這會成功嗎?為什麼不會成功?

 

學生:因為缺乏強制力。

 

教授:因為缺乏強制力。所以說本質上不是缺少溝通,協議的效力大於口頭約定,協議是有違約責任的,它影響收益,所以我可以和愛麗絲說好了,但回家之後我還是可以選α的,要是她還選β那就更好了。隨著課程的深入,我們會繼續討論更多類似的問題,但現在我們先回到之前的兩個案例。串通和法制的案例,即囚徒困境。他們怎麼能用強制力約束合同?為什麼他們不把對方招供出來?有些企業也能串通好呢!他們怎麼透過強制力約束合同的?他們的共識,怎麼來強制約束?

 

學生:因為他們互信。

 

教授:可能他們互相信任,但你信一個罪犯嗎?還有別的可能嗎?這個留鬍子的小夥子。

 

學生:可能是個零和賽局

 

教授:這就是個賽局,這個就是賽局過程

 

學生:但是結果…他們關心的東西不同

 

教授:結果導致收益不同。我有個簡單的說法,假如他們簽了一份書面協議,或乾脆口頭的,他們怎麼強制履行呢?

 

學生:其中一個跑掉了,但是五年後,坐牢的就會回來報復。

 

教授:對,簡而言之,這不是一般的協議。如果你坦白了,你是在自找麻煩。托尼•索普拉諾用暴力維繫這些協議,托尼•索普拉諾就是這麼幹的,這是黑手黨的做法,黑惡勢力在那些書面協議不受保護國家不斷壯大,比如前蘇聯新成員國,或者非洲。為什麼黑惡勢力在這些地方發展壯大?因為這是法律強制力的補充,它維繫所有合同,不管是不是合法的。

 

我保證,我們以後還會討論這些,在其他賽局下的收益情況。雖然我們沒立下合同,但是我們以後會回來履行這個承諾的。我們先來回顧一下之前的神學院,或者說比我們商學院的人更講道德的人。

 

我們來求成績賽局在此情況下的結果。局中人的收益不同會怎樣呢?這些都是可能的收益,先起個名,我們叫那類人「飯桶惡魔」,這些人不妨就叫「憤怒天使」吧!我沒寫過indignant這個詞,我寫的對吧?好像對了,In-dig-nant,憤怒天使。接下來我們探討一下,這就是他們的收益。這次賽局的基本結構還是不變,還是我選α和β,我對手選α和β,成績的評判和之前是一模一樣的,結果寫在先前那塊黑板上了。

 

但這次賽局的收益是這樣的,對角線上的還是(0,0)和(1,1),但是這兩處的成績是(-1,-3)。抱歉,效用是(-1,-3)和(-3,-1),這是怎麼回事呢?這並不是唯一的收益,只是個假設。假如我得到A我對手得C,沒錯,我開始得到3單位效用,但我感到愧疚,我因良心受到譴責,而晚上睡不著覺,所以減去我的罪惡感的負效用後,我只得-1,把它看成罪惡感吧!

 

相反如果我選β我對手選α,我得到C她得到了A,我回家後很難跟父母解釋,為什麼我只得到了C,然後我還得表示一下雄心壯志。同時,我對我對手感到憤慨,不僅我得了C,這還是她害我得C的,道義上的譴責又減去了3單位效用。

 

重申一下,我沒說只有這幾種可能的收益,這只是其中的一種可能罷了。假如這就是這次賽局的收益,不要猶豫,假設這些就是你們的收益,那你們在這次賽局裡會怎麼做?好好想想,然後寫下來,把你的選擇寫到筆記本的邊上,就寫α或者β就行,就是你的選擇。穿英格蘭隊服的小夥子,你沒在寫呀!

 

把你的選擇給同桌看看,下面請舉手,請大家舉高點方便裘德拍攝。多少人選擇α了?舉手,別害羞,快舉手,多少人選了β?多少人棄權了?不能棄權的。再舉一次,多少人選α?不能棄權。選β的呢?這次差不多平分秋色了。誰選了α?選α的請再舉一下手,這個小夥子你來回答,你為什麼選α?

 

學生:你能最小化你的損失,你得到0,-1而不是-3,1。

 

教授:很好,他說-

 

學生:這裡沒有優勢策略,所以-

 

教授:沒錯,他說選α是因為這樣做風險更小,在壞形勢下最好的選擇是減少損失。那有誰選了β?很多人選了β,選β的請再舉一下手,看看誰選了β,請舉手。請那位女士回答,你為什麼選β呢?

 

學生:因為要是你選α,你最多只能得-

 

教授: 好,這是個不錯的反駁理由。剛才的小夥子看的是最壞的情況,而這位女士看的是最好的情況。這裡最好的情況就是得1了。那我再來問一下,這裡有劣勢策略嗎?沒有,沒有劣勢策略。我們來驗證一下。如果我對手選α我選α得0,選β得-3,所以選α更好。但要是我對手選β我選α得-1,選β得1,此時選β更好。所以對方選α時我應該也選α,她選β我也應該選β,這裡沒有優勢策略。

 

我們只是改變了局中人的收益,賽局的結構,結果都一樣,但是人們在乎的東西不同了,所以我們得到了完全不同的答案。在第一個賽局裡,我們很顯然應該選α,但這次我們應該怎麼選就很不確定了,這種賽局也有自己的名字,我們在本學期會遇到,這個賽局叫「協和謬誤」。協和謬誤的問題我們以後再討論。

 

今天我們主要研究簡單賽局,主要要明白收益的重要性。我們改變了收益,我們改變了目的,那我們就改變了賽局,改變了結果。最基本的結論就是收益很重要,讓我們換種方式來解釋。雖然我不想透露我的年齡,但也沒辦法。我從小在英格蘭長大,當時有一個流行歌手,他叫喬•傑克森,後龐克歌手。我估計你們都沒聽說,因為他紅的時候你們才十多歲。傑克森有句歌詞這麼寫的,汝欲求之,必先知之。

 

從邏輯上講這是不合理的。很有可能你想要的東西,在你不經意間就到來了。但從策略上講,這是個不錯的想法,它能幫我們在分析賽局之前,先弄清我們的目的是什麼。所以說,收益很重要。我們還是寫他的歌詞吧!「汝欲得之,必先知之」。

 

坦白說,多少人知道喬•傑克森?看來我真的老了,哎!知道的人越來越少。

 

目前為止我們對這個賽局的分析,還停留在局中人都是飯桶惡魔,或者都是憤怒天使的階段呢!但我想讓這個賽局變得更有挑戰,我們來個混搭怎麼樣?比如,你們把自己想像成飯桶惡魔,這對你們來說不難,但是你知道你的對手是個憤怒天使。重複一遍,你是個飯桶惡魔,但和你賽局的是一個憤怒天使。

 

這種情況下怎麼辦?我們應該怎麼做?誰覺得應該選擇α?把鏡頭對準教室後面,先別放下手,讓大家都看見。誰覺得應該選β?誰棄權了?不能棄權,絕對不能棄權,第一節課就這樣了,但以後可不行。我們再來分析一下這個賽局。

 

這個賽局怎麼進行呢?是飯桶惡魔於憤怒天使的賽局。我們要把收益混合而在一起,只需要把之前的矩陣結合一下就可以。此時我還是用這個來表示我的收益會是什麼。我的收益就是飯桶惡魔的收益,收益和之前的矩陣是一樣的。誰幫我念一下收益?收益是0,3,-1,1,我的對手或者收益是憤怒天使的收益。她的收益在這裡,0,-3,-1,1。

 

大家知道我是怎麼做的吧?再說一次,第一個收益是飯桶惡魔的收益,第二個收益的是憤怒天使的收益,現在我們就把這個矩陣寫好了。我們現在來回答之前的問題。假設你是飯桶惡魔,你的收益是這樣的。你和憤怒天使賽局,你會怎麼做?這次也不允許棄權。誰會選擇α?請舉一下手,先別放下手。好,誰會選β?很少有選β的,基本都選的是α,α應該是正確答案。為什麼α是正確答案?這個小夥子你來回答。

 

學生:因為它是優勢策略。

 

教授:實際上這和之前的賽局沒什麼變化,別人的收益改變了,但對我的沒有影響,α是優勢策略,β是劣勢策略,在這裡α依然優於β,我們來驗證一下。如果我對手選α我選α,我得0。選β我得-1,選α更好。如果我對手選β我選α我得3,選β我得1,也是選α好。和從前一樣,對我來說選α比選β好,不管別人怎麼選,α優於β。

 

本節課第一個結論是什麼?大聲說出來。對,在這次賽局中,你們應該都選α,沒選α的人以後要注意了啊!這裡α還是優於β的。

 

現在我們換一下。假設你是一個憤怒天使,我知道這個對你們來說很難,但你現在知道你要和一個自私鬼賽局。

 

你是憤怒天使,你的收益還是這些。你要和自私鬼賽局,他的收益被擋住了。我再重新寫一下,我們來做這種情況下的矩陣。順便說一下,我可沒有把這個賽局弄得像摔跤比賽的意思。先寫上 α、β、對手、我,我的收益是憤怒天使的收益,即0, -1,-3,1。我對手的收益是我上個賽局的收益,他寫在另外一個矩陣裡了,我們來找找,在這個矩陣裡呢!收益是0,-1,3,1。

 

那個矩陣裡面的第二個收益,就是這次賽局的矩陣裡第二個收益,大家都明白了吧!這次還是第一個收益是我的,另一個收益是我對手的,這回你們怎麼選?你是憤怒天使,你和飯桶惡魔賽局,你應該怎麼選?在你筆記本上寫下你應該怎麼選,然後給你同桌看看,在你同桌面前你就不好意思不寫了吧!

 

舉一下手,讓裘德拍一下。選α的請舉手,然後先別放下手,誰選了β呢?只有一兩個β,基本都是選α的。我們來分析一下,我選α優於選β嗎?沒有,對我來說,選α並不優於β,策略α並不優於β。如果我對手選α,那麼我選α得0,選β的-3,此時選α較好。但是如果我對手選β,我選α得-1,選β得1,這回選β更好了。就像我們看到的,她選α我最好選α,她選β我也應該選β,這次沒有優勢策略,然而90%以上的人都選了α,選α是正確的答案。為什麼我們這回應該選α呢?留鬍子的小夥子你來說,等一下麥克風。

 

學生:我們發現了α是我們對手的優勢策略,所以我們必須要根據我對手會選α來做出選擇。

 

教授:很好,你的名字是?

 

學生:亨利

 

教授:亨利認為我們確實沒有劣勢策略,我選α並不優於選β,但是對我的對手來說,選α優於β,如果我選α她選α,她得0;選β她得-1;選α更好。如果我選β她選α得3,選β得1;選α還是比β好。對我對手來說α優於β,所以考慮到我的對手,站在她的立場上看,我發現她有一個優勢策略α,她會選α,藉於此情況,我最好也選α。

 

這回,對我來說,選α並不優於β,但是對我對手來說,選α優於β,所以她會選擇α,一旦我意識到她會選α的時候,很顯然我應該也選α來得到0單位效用,而不是選β只得到-3,所以我也選α。

 

目前為止我們看到了四種組合,一種是飯桶惡魔於與飯桶惡魔的賽局,一種是憤怒天使和憤怒天使的賽局,還有兩種是相反的賽局,自私鬼博弈憤怒天使,和憤怒天使博弈自私鬼。為什麼要學這些?因為有個重要結論,什麼結論啊?從中總結出的結論就是,分析賽局最重要的方法,或者說策略分析的重要內容,也就是策略分析的核心是要學會換位思考。去分析他們的收益是什麼樣的,然後以此得出他們會怎麼做。

 

這個賽局的重要結論,我忘了第幾個了,我記得應該是第四個。結論四,站在別人的立場上去分析他們會怎麼做,這是這門課第一個較難的結論。找出優勢策略很容易,弄清自己的收益很容易,但是現實中,要走出你自己的小圈子,去發現這個世界還有其他人,你要學會換位思考,去分析他們的收益是什麼,他們要怎麼做,並依此做出回應是很難的。

 

現實中我並不知道我對手的收益到底是什麼樣的,這會使事情變得更加複雜。弄清自己的收益總是要比弄清別人的收益要容易,我不太清楚到底我是在和自私鬼還是憤怒天使賽局,因此在做類似的賽局前,我們需要先弄清楚收益是什麼。我們會在本學期的最後再來深入學習這些。雖然現在說有點早,但是我們會學到的。

 

實際上,囚徒困境這個賽局,比如選擇α和β,或者類似的賽局,在現實中進行過很多次實驗。現實中,我覺得這裡應該能寫得下,現實中有人做了類似的實驗,他們發現大概70%的人選α,30%左右的人選β,差不多三分之一的人選β。是什麼原因呢?為什麼有三分之一會選擇劣勢策略呢?為什麼30%會選擇β?誰來回答?這個小夥子你來。

 

學生:可能有的人覺得,選擇β會使平均分數上升。

 

教授:可能他們都是高尚的人。現實中30%的人選擇了β,可能因為他們是好人。還有別的可能嗎?

 

學生:我知道這可能會稍微改變點這個賽局,但是如果你認為以後你還會和你的對手進行相同賽局…

 

教授:好的,他們可能覺得還會再次進行賽局

 

學生:每次都選β的長期的收益會更大

 

教授:可能是這些人覺得,這是他們沒有理解實驗的目的,他們認為這是多次賽局而不是單次賽局。還有別的解釋嗎?最簡單的解釋是什麼?最顯而易見的解釋是什麼?他們可能比較愚蠢。很可能啊!我們在課上不能這麼說嗎?

 

坦誠地講,不管是現實中的賽局實驗,還是你們在紐約時報上所看到的,談到現實生活中進行的經濟實驗,當屬亞利桑那大學的大學生。這可不是我瞎說的,事實就這樣,我不知道你們有沒有來自亞利桑那州的,亞利桑那大學的畢業生是都很陽光呢!還是他們「在陽光下曬得太久了」?我不知道哪一個是對的。憑這點我們還說不清。

 

那在耶魯大學,這個比例是怎樣的呢?你需要給你同伴一個麥克風嗎?在耶魯大學是238比36,就我的算數水準都知道,這絕對少於30%,我猜可能比較接近15%。238人選α,36人選β。我們再來總結出一個結論吧!雖然沒下課,但不妨再總結個結論。你們每天都要進行賽局,一直到十二月七日,期末的時候,互相看一下吧!你們最好多互相瞭解一下我們從你們身上能總結出什麼。

 

結論五,「耶魯大學的學生都很惡毒」。在進行賽局的時候都注意點。

 

在剩下這幾分鐘我們再玩一個遊戲吧!不管能不能提前下課了。還是先開始這個遊戲吧!你們是不是都有遊戲2?你們邊讀規則,我邊督促你們去簽署授權書,記得走時留下授權書,我們要收的。我們來說說這次的遊戲規則。過會我會把遊戲2和授權書都收上來的。要是你沒有授權書,或者不小心弄丟了,網站上也有。

 

好了,我們看看第二個遊戲,我來讀一下。遊戲2,「選數字」,你們都有吧?都有是嗎?

 

從1到100之間選擇一個號碼,填到下面的方框內,不要讓你同桌看到。我們會計算全班的平均數,誰選的數字最接近平均數的三分之二,誰就是贏家。所選數字最接近2/3倍平均數人是贏家,贏家的獎金是,5美元減去所選數和平均數三分之二之差的百分數。

 

為了讓大家都聽明白,我來舉個例子。還有一塊沒用過的黑板,不錯。假如有三個人,他們分別選了25、5、60,25加5加60等於90,我要是算錯了要提醒我,我總算錯。90對吧?90的2/3,我說錯了,我應該先除3得到平均數,平均數是30,總和是90,平均數是30,這回沒錯吧?平均數的2/3是20,我在絕望地看著助教,沒算錯吧?好,平均數是30,其3/2是20。

 

那誰是贏家呢?選25的是贏家,25最接近。那他會得到多少獎金呢?他將得到5美元減去5美分,就是4美元95美分。為了提起大家的興趣,動真格的了,要繼續,我得先拿出來點錢,但我還不能碰掉麥克風,我先看看我有沒有錢了,我看看我有沒有足夠的現金。在之前和MBA學生做這個遊戲的時候,那時候正趕上互聯網大繁榮,你得拿出來50美元他們才有興趣。對於研究生們,五美分就夠了。

 

票面上印著一個留著鬍子的傢伙,很顯然,這是林肯,誰認識林肯啊?沒錯,這是一張5美元的鈔票,我將要把它裝進一個信封裡面,我沒騙你們吧?這就是這個遊戲的獎金,把它交給一個大家信得過的人,這是經濟學159的獎金,你們信任誰?攝影師裘德,我們知道他下周還會來,我給裘德了,看視頻的你們看不到裘德,但我把錢給裘德了,我放到這裡了,裘德下周會帶著獎金來的。我覺得我們應該給後面的那個人,他看起來很老實。後面誰很老實啊?算了,就給裘德吧!他下周肯定來。好了,每個人都寫好數字了嗎?有沒有問題,大聲說出來。

 

學生:現在那裡只有一張5美元鈔票,是不是說只有唯一的贏家啊?要是這樣,怎麼確定誰是贏家?

 

教授:好的,要是有多個贏家,我們會平分獎金的。問得好,教室裡每個人都寫個數字,確實有可能出現多個贏家,每個人都寫了一個數字了吧?把你們寫的數字傳到最後一排,先別走,交到最後一排。最後,我們回顧一下五個結論。本節課的五個結論,你們都記住了嗎?別看筆記,告訴我這五個結論。誰知道哪五個結論?這位女士,請大聲說出一個。

 

學生:不要選擇劣勢策略。

 

教授:不要選擇劣勢策略,還有嗎?

 

學生:耶魯大學的學生很惡毒。

 

教授:耶魯的學生很惡毒,兩個了,還差三個。那個小夥子。

 

學生:理性選擇導致次優的結果。

 

教授:這條我們用矩陣表示的,還差兩個。

 

學生:學會換位思考。

 

教授:還差一個了,但是我想不起來還缺什麼。

 

學生:你無法得到想要的-

 

教授:你無法得到想要的。你能,但最好事先弄清楚,就是,汝欲得之,必先知之。今天我們學到了五個結論,別忘了把授權書和數字交上來,週一見。

 

 

講座2-換位思考

影片請按此下載

閱讀中文字幕純文字版本

 

第二講概述:

在講座的開始,我們介紹了遊戲的「組成要素」:參與者,他們的策略和收益。然後回到上堂課的主要結論:不要採取劣勢策略,並且要換位思考。首先,我們將這些運用在對抗漢尼拔將軍以捍衛羅馬帝國;然後運用在上堂課遊戲中所選擇的一個數字。我們學習到,當你以他人的立場換位思考時,你不僅應該考慮他們的目標,也應該考慮他們有多老練,(他們是理性的嗎?),以及他們對你的瞭解多少(他們知道你是理性的嗎?)。我們介紹了一個新的想法:重複剔除劣勢策略。最後,我們討論相互知識和共同知識之間的區別。

 

閱讀作業:

杜塔著《策略與賽局:理論與實務》第二章第3節;第三、四章

喬爾•沃森著《策略:賽局理論簡介》第六至八章

迪克特及奈爾巴夫著《策略性思考》第三章,1-3

 

資源:

第二講黑板筆記 [PDF]

 

講座2-換位思考

 2007910

Ben Polak 教授:上節課我們做了這樣一個遊戲,大家透過選擇α和β來確定各自的成績,這個表格列出了可能的結果,具體說就是你和對手分別得什麼成績。比如說你選了β而你的對手選了α,你會得到C而你的對手會得到A

 

有一點需要強調一下,這還不能稱之為賽局,它缺少了一些東西。這個遊戲有不同的結果,我們用結果矩陣來表示,但它不是一個賽局,因為我們必須知道收益才能進行賽局。後來我們分析了可能的收益,現在它變成一個賽局了。用專業術語來說,這個賽局屬於標準式的賽局,在這裡,我們假設這些收益是那些只關注自己成績的人的收益,我覺得你們很多人就是這樣,但坐在那邊的先生不是這樣,但對很多人就是這樣。

 

我們指出,此賽局中α嚴格優於β,這是什麼意思呢?我們說如果這是你的收益,那麼不論你的對手選什麼,你選擇α總會比選擇β得到更好的收益。在繼續講下面的內容之前。我們先來回顧一下上節課的結論。其中的一個結論是,不要採用嚴格劣勢策略,大家都記得這個結論吧?在這之後,我們透過研究更複雜的收益,以及更複雜的賽局,我們得出了另外一個結論;站在別人的立場去思考他們會怎麼做。

 

實際上,我們從中學到的是,不僅你自己的收益很重要,這當然很重要,但別人的收益也同樣重要,因為你要儘量想到別人會怎麼做,然後做出恰當的回應。我們今天繼續探討這兩個結論,今天這兩個結論還會再出現。今天所講的很多內容會很抽象,但我想要提醒大家,賽局理論與現實世界是緊密聯繫的。

 

其次,好心提醒一下大家,這個賽局被稱為囚徒困境,我寫在那裡了,囚徒困境。注意一下,囚徒是複數形式,上節課我們列舉了幾個例子,讓我再次重申並強調一下,我們會涉及到更多的案例,這樣你筆記內容就會更豐富了。比如說你和別人要進行一個合作專案,可能是家庭作業,或者像他們正在進行的視頻採集專案,它能變成一個囚徒困境。為什麼呢?因為大家都想偷懶。價格競爭,兩家互相打價格戰的企業可能會陷入囚徒困境。為什麼?因為不管你對手怎麼定價,你總有想削弱他們的動機,如果雙方都採取這種策略,那麼價格將會下降到邊際成本,行業利潤將會遭受損失。

 

在第一個案例中,如果大家都偷懶,成果會糟得不堪設想。在第二個案例中,如果兩家企業互相削弱,最終會壓低價格,這對消費者有利,但對企業不利。讓我來舉第三個例子。假如這裡有一個可利用的公共資源,比如是個魚群,或者是新鮮的空氣,這其中也會導致囚徒困境。你有過量捕魚的動機,為什麼呢?因為如果其他國家擁有這個魚群,假設這個魚群在大西洋,如果其他國家打算正常捕撈,你應該也會正常捕撈。如果其他國家不打算減少捕撈量,那麼你現在就想先把魚都撈起來,因為沒準明天就會無魚可撈了。

 

下一個囚徒困境的案例,是全球暖化和碳排放量問題。拋開科學層面來說,我相信在座的一些同學比我知道的還多。碳排放問題也是個囚徒困境。通常我們每個人都有排碳的動機,如果大家都想減排,我沒必要跟風。如果別人真的減排了又與我何干?我照樣用著熱水,開著大排量汽車。這些情況都導致了糟糕的結果。所以這點在社會層面上很重要。這不僅僅是耶魯課堂上的抽象概念,從上課一開始,我們就應該開始思考這些問題解決方案,現在我們已經談論了一些了。需要指出,這不僅僅是溝通失敗,溝通本身並不能化解囚徒困境。你可以在減排問題上一直高談闊論,但當你回家時,你仍然會開著你的悍馬,每天洗十六次熱水澡,我們依然在大量排碳。

 

你大談特談你在多麼努力地做家庭作業,但是回家後如果你依舊偷懶,這還是無濟於事。實際上,如果其他人正在努力工作,或者正在儘量減少碳排量,你總會有想偷懶的動機,或者總是繼續大量排碳。我們需要跳出這個思維定勢,我們可以考慮制定協約,我們可以考慮各國之間簽訂協約,我們可以考慮制定規章制度,只要改變收益,這些方法都有效。這不是說說而已,但它確實改變了結果。改變了收益,也改變了動機。另一個重要的東西是,我們可以考慮把單次賽局轉化成重複賽局,然後看看是否有效。我們以後再來學習這部分內容。

 

還有一種方法,但我們必須慎用,就是透過教育來改變收益。我認為這就像毛澤東思想的理論似的,把人們鎖到教室裡教育他們要做個好人,這似乎無濟於事,我對此也並不樂觀,但至少我們得承認,它改變了收益。

 

就先回顧到這裡吧!我們繼續講課。上節課我們還有一個問題還沒搞定,我們在上節課最後做了一個遊戲,你們每個人都選了一個數字,你們所有的人都選擇了一個數字,選擇的數字最接近全班平均數的三分之二的人就是贏家。現在我們已經知道誰是贏家了。我知道你們都想知道自己是不是贏家,對嗎?我留下個懸念,我會告訴你們誰是贏家,我們已經算好了,我會告訴你們的。但我們得先幹點事,我先在這裡留下懸念,以防那些只想著贏的人蹺課走了。

 

我們在課上會經常透過遊戲學習賽局,我們還會舉行隨堂討論等等,但是我們也需要花費一些時間來慢慢研究一些問題。接下來的二十多分鐘就是這樣的,抱歉接下來的二十多鐘分可能有點枯燥,我們來做點正經事,就是我希望大家都夠理解,賽局的要素有哪些。具體來說,我們需要搞清楚怎麼樣才能形成賽局。

 

賽局由以下要素組成;參與人,首先我們得規定一下表述法,就是參與人的表述法。我們用小寫i和小寫j來表示吧!在那個數字遊戲中,你們每個人都寫下了一個數字,然後在下課前交了上來,誰是參與人呢?你們就是參與人。我的意思是說,你們都是參與人。在數字遊戲中,每位同學都是參與人。我再強調下,你們都是參與人。

 

賽局的第二個要素是策略,良心的建議,請大家和我一起記筆記,策略;表述法,我們用小寫si來表示參與人i的某個策略。例如他在那個遊戲裡選擇了數字13,大家都聽明白了吧?我們需要把這個特定的策略,和參與人i的可能策略集合區別開來。我們用大寫的Si來表示什麼?來表示策略集合,即參與人i的所有可能策略的集合。上節課我們最後做的遊戲,策略的集合是什麼樣的呢?這個集合由123,一直到100組成。

 

當需要表示策略集合中的一個特定策略時,說到這,我們來定義第三個標記符號。我們用不帶下標的小寫s來表示某一次賽局,這是什麼意思呢?上節課大家都交上來了一個數字,所以每個人都有對應的數字,這就是每個人都有一個策略。我手裡的是我收上來的策略集合,這些就是你們上節課交上來的表單,這就是一次特定的賽局。

 

我有你們每個人的名字和所選數字,即每個人的策略,我們還製作了一張試算表,所有資訊都收錄到了試算表中,你們每個人的名字和所選數都在這裡,這就是一次賽局。給它起個名字,我們稱它為一個策略組合,你會看到有的課本中稱它為策略組合,策略向量或者策略列表,這無關緊要,它表示每個參與人都有一個對應的策略。

 

這就是數字遊戲的試算表,或者說這是其試算表的一個樣本。我需要把這塊黑板拉下來,以便你們還能夠看到,讓我擦一下黑板,你可能覺得我們搞定了,對嗎?我們有參與人,我們有他們可能選擇的策略,就是策略集合,我們有每個人的策略,我們還有他們每個人已經選擇的策略,即策略組合,看起來我們好像得到了進行一次賽局所需的所有的要素。

 

我們少了什麼?大聲喊出來。我們缺少收益。為了使它成為賽局,我們需要收益。我們用符號來表示收益。在本課中,我用符號U來表示參與人的收益,Ui取決於參與人1的策略,這些都是影響參與人I收益的因素,一直到參與人N的策略。參與人i的收益Ui由所有參與人的策略決定,當然也包括她自己的策略,簡寫應該是Ui(s),它由策略組合決定。

 

那麼,在數字遊戲中它是怎樣的呢?在數字賽局中Ui(s)代表這兩件事,如果你贏了就是五美元減去你的誤差,我覺得也有可能是平局,這點暫時先不去考慮,除此以外就是一無所獲。現在這個賽局的所有要素都有了,參與人、策略和收益。現在我們不妨作一個假設,這個假設在接下來的十多周都要用到,差不多是整個課程都要用到。我們假設這些都是已知的,我們假設每個人都知道其他人可能選擇的策略,每個人都知道其他人的收益,這不是一個很符合實際的假設,在期末的時候我們再來推翻這個假設,但是就這個假設下的內容,就足夠我們接下來的十個星期學的了。

 

我需要再引入一個符號,之後我們再繼續研究。s-i是什麼意思呢?它表示除了i外其參與人的策略,這個符號是我們會經常用到的。它表示除i外其他參與人每人的策略,具體來說,如果你是參與人1,那麼si-可能表示s2、s3、s4,直到sn,但是不包括s1。這個表述法有用,為什麼?因為有時候,考慮在i和對手在不同選擇下的收益是很有必要的,這是一個有效的思路。

 

現在我們暫停一下,根據之前的教學經驗,我知道有些人有數學恐懼症,如果你有數學恐懼症你不必舉手示意,既然有人是,那麼讓我們深呼吸一下,在家看視頻的數學恐懼症患者也一起做,現在大家不那麼緊張了吧?你今天坐在這,你知道一切都會好起來的。現在我將會在黑板上寫一些數學運算,深呼吸,這沒有你想像的那麼難,我只不過寫下了一些符號,這裡不會有數學運算,我只是在寫符號。

 

我不希望你們因為對數學,或是數學符號的恐懼而放棄這門課。所以如果你是因為懼怕數學,而可能會選擇放棄這門課,歡迎來找我和助教傾訴,我們會幫你搞定的。數學恐懼症沒什麼大不了的,我害怕很多東西,不一定是數學,也可能是各種各樣的事物。很多人面對符號往往都望而卻步,看起來它比這個更可怕。而在這裡,其實僅僅是符號而已,我們舉個例子來幫助理解。

 

稍等一下,讓我來擦下黑板,讓我來舉一些例子,來幫助那些對這些符號感到困惑的同學。我們來簡單地看一下下面這個賽局。此賽局有兩個參與人,分別為III,參與人I有兩個選擇,上和下;參與人II有三個選擇,左中右,這是一個很簡單的抽象案例,讓我們設想收益是這樣分配的。它們不是特別有趣,它就是一個為了解釋用的例子,收益是這樣的,(5, -1), (11, 3), (0, 0), (6, 4), (0, 2), (2, 0).。

 

讓我們來看一下這個賽局中的符號。首先,誰是參與人?沒什麼好解釋的,參與人是,讓我們把它寫在這吧!這次賽局中有兩個參與人,III,那麼策略集合是怎樣的呢?這是參與人I的策略集合,她有上下兩種選擇,用橫排來表示,即上下兩排。參與人II有三種選擇,這個賽局不是對稱的,所以他們可選策略數量不同,這無所謂。參與人II有三種選擇,左中右,用矩陣的左中右三列來表示。

 

順便說一下,到目前為止,我們所學的大部分是對稱賽局,但注意此賽局的策略與收益是非對稱的。賽局未必都是對稱的,收益,這也不是天書,沒那麼可怕的,我們隨便寫個收益吧!參與人I的收益,如果她選上,參與人II選中,我們來看一下上行和中列。參與人I對應第一個收益,即11,在這種情況下,參與人II的收益,即參與人I 選上參與人II選中時,注意下是上行和中列,但是現在我們要找參與人II的收益,也就是第二個收益,即3

 

我相信有數學恐懼症的現在好多了吧!下面來看看這次賽局是如何進行的。這不是一次特別有趣的賽局,既然說到這裡了,不妨多討論一點,我們的麥克風準備好了沒?大家認為這個賽局會如何進行下去?我們隨便找個同學來回答一下,艾爾,那個穿藍襯衫的男孩,參與者I有劣勢策略嗎?

 

學生:不,參與者I沒有劣勢策略。例如,參與者II選擇左,參與者I會選擇下;但是若參與者II選擇中,參與者I會選擇中。

 

教授:好,太棒了,非常好,你應該站起來回答問題的,我忘記說了,不過沒關係,這位同學解釋的很清楚,謝謝。同學們都聽清楚了嗎?都聽懂了嗎?後面的同學聽見了嗎?這樣聲音還是太小,所以我希望之前的同學的解釋清晰正確,但以後請大家站起來大聲點說,否則後面的聽不到。你的名字是?

 

學生:派翠克

 

教授:派翠克剛所說的是,參與者I沒有劣勢策略。在左列下,選上比選下…我說錯了,在左列下選下比選上要好,因為6大於5。但在中列下,選上比選下好,因為11大於0,大家聽懂了嗎?也就是說選擇上並不總是最優的,上並不總是優於下,或者下並不總是優於上。這次舉手回答,參與者II呢?參與者II有劣勢策略嗎?你們都果斷得把手放下來怕被拍到嗎?艾爾,穿白衣服的小夥子站起來等著艾爾走過去,並且大聲地告訴我們答案。

 

學生:我認為參與者II選擇右是劣勢策略。因為如果參與者I選擇上,那麼參與者II會選中,並且如果-我弄混了,在我草稿上不是這樣的,但是右絕不是最優策略。

 

教授:很好,我們認真一點,你叫什麼?

 

學生:湯瑪斯

 

教授:湯瑪斯所說的是對的。但這的確與劣勢策略的定義不太相符,湯瑪斯所說右並非總是最優策略,這是對的。想要成為劣勢策略還要滿足別的條件,即需要參與人II存永遠占優勢的策略,這個例子可以證明。我們來看看。

 

在這次賽局中,我說中優於右,我們看看,如果參與者I選擇上,選中的收益是3,選右的收益為03大於0。如果參與者I選擇下,選中的收益是2,選右的收益是02大於0。所以這個賽局中,中嚴格優於右,你剛才說的是對的。但我想要得到與優勢有關的回答,從中我們得出參與者II不應該選右,目前為止,這些就是我們透過此賽局得到的全部與優勢有關資訊了。然而,我們來再深究一下。

 

上節課我給出了嚴格優勢的定義,並且講義中也有。順便說下,講義可以在網上看到,但是現在我們用這些符號,來重新作一下優勢策略的定義。定義是:參與者i的策略s'i,嚴格劣於參與者i的另一個策略si。現在我們要使用符號了。在其他參與人選擇s-i時,選擇si的收益UI(si)嚴格優於此情況下選s'i的收益UI(s'i)。最重要的一點是,對所有s-i均成立。

 

用文字來描述就是,參與人i的策略s'i嚴格劣於si,如果si總是更好的選擇,即總能給參與人i帶來更高的收益,而無論其他參與人怎麼選。這個定義和我們上次講的是一致的,只不過使用了些符號使它變得有點枯燥。大家都談符號色變,你們像被前照燈照到的小鹿那樣亂竄嗎?沒有,我看大家很冷靜。

 

那我們再來看另外一個案例。你們記完筆記了嗎?我要換黑板了。好的,這是一個更有趣的例子,想像一下這樣的例子。一個侵略者打算入侵一個國家,有兩條路,想像成兩個關口也行,侵略者必須透過一個才能進入。你是國家的防禦者,你必須決定在哪個進入關口,或者在哪條進軍路線上佈置你的防線。問題是,你只能防守二者之一。

 

現實世界也有這樣的例子。大概在西元前三世紀,如果我說錯了請大家來糾正,我記得是西元前三世紀,當時漢尼拔想翻越阿爾卑斯山,我說的不是漢尼拔·萊格,而是西元前三世紀的漢尼拔將軍,那個騎大象的漢尼拔將軍。好了,這裡的關鍵問題是,有兩條路,一條路崎嶇,需要翻越阿爾卑斯山,另一條路平坦,只需沿著海岸線走。如果侵略者選擇崎嶇的路,僅在穿越阿爾卑斯山的途中,他就要損失一個營的兵力,這就是選崎嶇之路的代價。如果他碰巧遇到了你設防的途徑,無論崎嶇之途還是平坦之途,他還要再損失一個營的兵力。

 

我還沒有說完,我給出了大致的選擇,入侵者選擇從哪個途徑入侵,而防衛者選擇在哪裡設防。但我們需要搞清收益後才能分析此賽局。這個賽局的收益是這樣的:這是一個簡單的二對二的賽局,這個是入侵者,即漢尼拔將軍,這個是防守者,我忘了哪位將軍是防守者,最好有人來告訴我。你要選擇兩條途徑中的一條設防,平坦之途的或崎嶇之途。同樣他也有兩條路入侵途徑,平坦之途和崎嶇之途。強調一下,平坦之途不用翻山越嶺,我們說的不是新澤西收費公路。

 

收益如下,我簡單來解釋一下入侵者的收益,是他攻入你國家時還剩餘多少兵力。他只有兩個營的兵力,而你的收益是入侵者損失多少兵力。舉個例子吧!如果入侵者與你在崎嶇之途上狹路相逢,他在翻越山嶺時損失一營,與你交戰再損失一營,那麼他全軍覆沒而你得到一場完勝。相反,如果他選擇崎嶇之途,而你卻防守平坦之路,那麼他僅僅損失一個營的兵力,他還留有一個營的兵力。他的確在翻山越嶺時損失一營,但是他只會損失一個營,因為你選擇了在錯誤的途徑設防。

 

大家明白了這個賽局的收益吧?現在想像自己是一位羅馬將軍,發揮你的想像力,想像你是一位羅馬將軍,我們來看看你應該怎麼辦。你是防守者,那麼你應該在哪設防呢?大家舉手表決,有多少人選擇防守平坦之途的?請舉手,讓裘德可以拍到你,先別放下手,再舉一小會,揮一下手,應該給你們弄桿軍旗來才對。這些都是鎮守平坦之途的羅馬士兵。那麼有多少人選擇防守崎嶇之途?我發現有很多同學不想成為羅馬將軍啊!

 

再來一次,不能棄權,準備好了嗎?即使你答錯我也不會為難你。那麼多少人選擇防守平坦的之途?再次舉起手來。有多少人選擇防守崎嶇之途?大多數人選擇平坦的路,絕大多數。接下來我們看看,防守平坦之途是否優於防守崎嶇之途呢?是這樣嗎?防守平坦之途是否,到底是不是優於防守崎嶇之途呢?你可以大聲喊出來,不,不是這樣。

 

我們來分析一下。如果入侵者選擇平坦之途,毫無疑問,如果你選平坦之途要比崎嶇之途更好,10。但如果入侵者選擇崎嶇之途,仍然是毫無疑問,這不是一個合理的答案。防守平坦之途並非優於防守崎嶇之途,你只是想剛好截擊到入侵者,然而大多數人都選擇防守平坦之途了。為什麼呢?有人知道原因嗎?把麥克風準備好,能不能到那邊的留鬍子的小夥子來說一下。請稍等片刻,等麥克風過去,你站起來大聲說出來吧,開始吧!

 

學生:因為你想使入侵羅馬的敵軍兵力最小化

 

教授:你想最小化入侵羅馬的兵力,沒錯,但是我們剛才說這裡沒有優勢策略,平坦之途並不總是優於崎嶇之途,還有其他原因嗎?我看到你舉手了,請那位坐在中間舉手的小夥子說說吧!還是一樣,請起立對著麥克大聲講,臉面向麥克風,好的。

 

學生:雖然看起來你好像沒有優勢策略,但似乎漢尼拔將軍最好的選擇是,他應該會選擇從平坦之途入侵。

 

教授:好的,為什麼似乎是這樣的呢?很好,我們要步入正軌了。為什麼他應該會選擇從平坦之途入侵?

 

學生:如果你沒有在平坦之途設防,他兵力不減。然而如果他從崎嶇之途進軍,那麼他將至少損失一個營。

 

教授:我們回頭看一下,來回顧一下想想我在剛上課時說的教訓。我們應該站在漢尼拔的立場來看問題,管他穿的是鞋子還是靴子呢?不管你是騎著大象也好,還是穿著別的也罷,我們應該從漢尼拔的立場來看待問題,並且試著推測漢尼拔會怎麼做。站在漢尼拔的立場,他應該不知道你會防守哪條路,但讓我們看看他的收益。

 

如果你們都選擇的是平坦之途,那麼他攻入你的國家時他只剩一個營,這與他選擇崎嶇之途別無二致。那麼如果你防守平坦的路,從他的立場出發,無論怎麼選擇,選崎嶇之途收益是1,而選擇平坦之途的收益也是1。但是如果你選擇防守崎嶇之途,即你要低於高山巨嶺,而他卻選擇的是平坦之途,他將兵力全存。而要是選崎嶇之途,他將全軍覆沒,這樣來看,選擇平坦之途要好些。

 

我們要更嚴謹一些。對漢尼拔而言,選擇平坦之途入侵並不是嚴格優於選擇崎嶇之途的,但是在這種情況下有一個弱優勢,對入侵者來說,我們再引入術語,對入侵者而言,平坦之途弱優於崎嶇之途。我所說的弱優於是什麼意思?它意味著選擇平坦之途較選擇崎嶇之途而言,至少要同樣的好,可能還稍微好些。

 

這裡我們給出第二個定義,也是今天的一個新定義,我們再一次用到術語。定義是,參與者i的策略s'i弱劣於其他策略si,下面我們會發現用符號的好處了。在對手選s-i的情況下,參與人i選擇si的收益,等於對手選s-i下她選s'i的收益,而且在任何情況下此條件均成立。除此之外,對手選s-i參與者i的策略si,嚴格優於其他策略s’i,至少在某種情況成立。

 

驗證一下,這和我們之前選擇平坦之途還是崎嶇之途是對應的。重申一下,參與者i的策略s'i弱劣於策略si,無論對手怎麼做,她選擇si的收益至少與選s'i的相等,有些情況下甚至是嚴格佔優的。這似乎是一節相當重要的課,我們說過,不要採用嚴格劣勢策略,你也不應該採用弱劣勢策略,不過這個更嚴密一些罷了。

 

對於這個定義,如果你還有些疑問,而且你想看用文字表述的,在講義中有,我已經上傳到網上了。裡面有第一節課的總結,也有這個定義的文字形式,不妨去對比一下這個定義的文字表述與黑板上的符號表述。好了,既然我們認為入侵者漢尼拔不會選擇弱劣勢策略,我們認為漢尼拔不會選擇崎嶇之途,他會選擇從平坦之途入侵,這種情況下,我們又該如何設防呢?我們應該防守平坦之途,大多數人都這麼選。

 

坦白地講,這是你們的理由嗎?有可能是,我們能理解這些道理。那麼我們從漢尼拔的角度來考慮一下。我們發現崎嶇之途是弱劣勢策略,他會選擇平坦之途,我們應該在此設防。然而事實上,漢尼拔選擇的是翻山越嶺,這有點和這個結論相悖,但這也沒有辦法了。

 

好吧,我承諾過會講上節課的數字遊戲,我們到現在講了很多了。上節課我們學到了,不要採用劣勢策略。然後今天我們學到了,我們有時可能不會選擇弱劣勢策略。我們還學會了站在別人立場上思考,然後推測出他們不會選擇嚴格劣勢策略或弱劣勢策略。這似乎是預測別人選擇策略的一個不錯的方法,那麼我們帶著這些方法,回到上次的數字遊戲中。

 

在家看視頻的人不必關心這個。上節課你們多少人來了?多少沒來?我問得有問題,上節課有多少人沒來啊?那我們再說一下那個數字遊戲吧!再來介紹一下這個數字遊戲。但是以防萬一,我來介紹下遊戲規則,那個遊戲是這樣的。

 

在不被你同桌看到的情況下,在方框裡寫下一個介於1100之間的數字,我們將計算,實際上已經計算完了,班裡同學所寫數字的平均數,最接近平均數的三分之二的人,是這個遊戲的贏家。獎金是五美元減去所選值與答案之差。

 

上節課每位同學所填的數值都在我這兒,揭曉贏家前,我們先分析一下此遊戲,我先走下講臺看看各位,麻煩準備好麥克風。

 

那讓我看下大家填的是多少。你們坦誠點吧!我有所有的資料,有多少人選了32、33或是34?有一個人舉手了,實際上九個人這麼選的。我需要把名字念出來讓你們尷尬一下嗎?利奈特、魯克森、克裡絲汀、博貞,有九個人,再舉下手示意一下。到底有多少人選了3234之間的數?很好,這次舉手的人多了,先別放下手,你們為什麼這麼選?把話筒遞給那位同學,你叫什麼名字?能站起來嗎?站起來一下,大點聲。你叫什麼?

 

學生:克裡斯

 

教授:克裡斯,你好像在這個名錄裡,也許你不在名錄裡,不要緊,你選了什麼?

 

學生:我想我選的是30

 

教授:30,是挺接近的。那你為什麼選擇30?

 

學生:因為我想每個人都會選45左右的數,因為66約等於一百的2/3,而大家會選比那小的,我就選了更小的數。

 

教授:謝謝,讓我們再問問另一位同學,這還有一位,選33、34的請再舉下手,坐在這裡的那位同學,你能站起來嗎?你在兩個麥克風之間,就是你,好的,大聲點。首先你叫什麼?

 

學生:瑞恩

 

教授:瑞恩,我這兒肯定也有你的數,不要緊,你選了什麼?

 

學生:我記得是33

 

教授:33,你的確是選了它,你是瑞恩•洛嗎?

 

學生:是的

 

教授:好的,瑞恩·洛,請講。

 

學生:實際上我的想法和克裡斯的相近,我也在想我們得選平均數的2/3,每個人都在1100中選擇的話,最後結果可能是33,會接近於平均數的2/3

 

教授:我再重複一遍。他剛才說,再提醒一下大家,說的時候大點聲,因為我感覺剛才有些人沒聽清楚,所以我重複一遍,讓大家都聽清楚。選擇33的理由是,如果大家在1100之間隨機選擇,平均數會是50左右,而502/3大概是33,確切地說是33 1/3。這個思路聽起來很有道理,那麼這個思路到底存在什麼問題呢?請那位穿條紋襯衫的女士發言,我們很久沒找女性發言了,這次找個女士來回答吧!

 

學生:因為即使每個人都像你這麼想,33還是太高了。

 

教授:就是說如果每個人都像你這麼想,33還是太高了。如果其餘的每個人都那麼想的話,如果每個人都會選擇33或者34,那種情況下,平均數會是多少?抱歉,平均數的2/3會是多少?應該在22左右。

 

所以克裡斯和瑞恩的說法的漏洞在於,這並不是一個錯誤的說法,這是一個很好的出發點,但其中存在漏洞,其中的漏洞在於第一句話。第一句話是,如果教室裡的人隨機選擇,那平均數會落在50左右,這很對。問題是教室裡的人並不會隨機選擇,看看你們的周圍,看看你們自己,你們有人是亂數生成器嗎?實際上,有些人好像真是,我就不念出名字了,你們中有的人沒準真是亂數生成器。

 

總的來說,耶魯大學的學生不是亂數生成器,他們想要成為這個遊戲的贏家,所以他們並不大可能隨機選數。繼續分析,如果每個人都這麼想,而且你明白大家都會這麼想的話,那你會預計每個人都會選擇33,而這種情況下你應該選擇22

 

你們當中有多少人,舉下手,你們當中有多少人選了2123的數?絕對不止這麼少,難道要我念出來你們的名字嗎?應該有有十二個人,快舉手,應該有十二隻手舉起來,兩個、三個人舉手了,四個、五個,實際上有十二個人選了22,所以加上選2321的會更多,我猜你們這些人是按照這個思路選的吧!請選了22的同學發言,這裡有一位,助教能遞話筒給他嗎?你叫什麼名字?請站起來大聲點說。

 

學生:裡安

 

教授:你選了22嗎?

 

學生:我選了22,因為我想大多數人在遊戲中,可能會多次求平均數的2/3,最後會得出30以下的數。

 

教授:如果你認為大家會按這種方式推理的話,確切地說就是如果你認為大家會依照瑞恩和克裡斯的策略而選擇33的話,22看起來是個不錯的選擇。但是你也低估了你的耶魯校友,事實上,22還是太高了。好吧,我們重申一下這個遊戲的要點,我們再來重申一下吧!這裡的要點是當你在進行遊戲時,你想要推測出其他人的想法,想要推測出他們可能的選擇,假設別人是亂數生成器可不是一個很好的出發點。他們都想贏,他們有自己的策略。

 

讓我把這張表寫上黑板,那麼這裡有沒有可以直接剔除的策略呢?我已經說了大家並不是隨機選數的,有沒有可以直接剔除的策略呢?我們知道大家不會選擇這些策略,找位同學來回答,綠衣服的你來答吧!請等艾爾過去,好了,請站起來,告訴我你叫什麼?

 

學生:我是尼克

 

教授:大點聲讓大家都聽清楚

 

學生:沒有人會選擇超過50的數

 

教授:沒有人會選擇超過50的數,好的,這個回答很好,雖然有人那麼選了,但這個回答很好。我本來想得到一個稍微……很好,我本來想得到一個不這麼直接的回答。有人選66了,那我們來分析一下,還有一些人選擇了大於67的數。當然,我們開始說的是66,順便把大於67的數一起分析了吧!選大於67的數有什麼不對的嗎?這樣選錯在哪裡?請舉手回答。錯在哪了?請穿紅上衣的小夥子回答,請起立,說出你的名字,大點聲說。

 

學生:彼得

 

教授:好的

 

學生:如果每人都選100,答案會是67

 

教授:好的,如果每個人,教室裡的每個人不是隨機選擇數字,而是全選了100,這好像不太可能,但如果每個人真的都選了100,就是最大的數,那平均數,抱歉,平均數的2/3會是662/3,此情況下67應該是個不錯的選項,那些選大於67數的人看起來挺傻的了。但他們傻不傻不是我們要關心的問題,那些選擇大於67的數的同學,如選68及以上的人,怎麼來評價呢?我們怎麼評價他們的選擇?找你身後的,你身後的那位女士,請大聲說。

 

學生:他們這麼做沒有收益

 

教授:他們沒有收益。用術語怎麼說?我們得用術語來說,哪位能喊出來,術語怎麼說?他們處於劣勢,這些策略是劣勢的。實際上只是弱劣勢,但這麼說也對,他們當然是劣勢的。準確地說,選擇80是劣於選擇67的,選擇67的話你總會獲得較好的收益,至少也是跟選80的收益一樣高,有時候比選80的收益更高,不管別人選擇的是什麼樣的策略,所以這種選擇是劣勢的。從上堂課中,我們學到了不要採用這類策略,他們是劣勢策略。

 

但還是有人選擇大於67的數,對嗎?我不會把他們的名字念出來,事實上你們當中有四名同學這麼選的,我也不打算讓你們舉手了。好吧,這四位同學,沒事了,你們下次要注意。一旦我們剔除了有人會選擇大於67的數的可能後,68100之間的數就無關緊要了,就如同這遊戲的可選項只有167之間的數字了,是吧?我們知道沒人會選擇68及以上的數,所以可以忽略它們,我們可以剔除那些策略。一旦如此,剩下只有167的數。

 

有誰能幫我總結一下,目前為止我們能得到什麼結論?68100的選項不存在了,或者說已經被剔除了,那我現在可以得出什麼結論?遞過來一個麥克風好嗎?請站起來等著麥克風,麥克風來了,好的,大點聲。

 

學生:那這樣45以上的也一樣被剔除了。

 

教授:很好,你叫-

 

學生:亨利

 

教授:亨利說,一旦我們明白了沒人會選大於67的數之後,我們可以再深入一些,如果這些類似策略不存在或者被剔除,那麼相似的策略也會被剔除,即大於45的數會被剔除。這裡我們須要認真一些,對於選擇大於45而小於67的數,我認為他們並不是,在原賽局中並不是劣勢策略。準確的說,我們僅僅論證了,如果教室裡每個人都選擇100,那選擇67會獲勝,所以在那種情況下,選擇4567之間的數並不是劣勢策略。但一旦我們剔除了原劣勢策略,即選擇67及大於67的數之後,他們才是劣勢策略。

 

所以這些策略,對於這裡的弱一詞,我們要謹慎對待。這些策略在原賽局中並不是弱劣勢的,可是一旦我們排除掉了68100的數,他們就成為了劣勢的策略,即弱劣勢策略。至此所有4567的數也被剔除了。好的,我們看一看,有人選了嗎?請大家踴躍舉手,有誰選了4567之間的數,或是4667之間的數?沒人舉手。我知道誰選了,我有統計表的,至少有四名同學,我就不念名字了,但是我下次可能會念。注意有四名同學選擇這樣的策略。

 

請注意,這裡的不同之處在於,剔除67以上或者68以上的過程,僅僅用到了上堂課所提到的第一個結論,即不要採用劣勢策略。雖然這裡是弱劣勢,但同理,但排除4567的第二個區間時,還牽涉到了別的內容。你需要從你的同學的角度思考,明白他們也不會選擇67及以上的數。

 

所以第一個過程是直截了當地。而第二個過程,我從別人的角度思考,發現他們並不會選擇劣勢策略,所以,意識到他們並不會選擇劣勢策略後,我也不應該選擇4567的數,所以這是個換位思考式的過程。那接下來呢?我們該怎麼辦?請那位留鬍子的同學說一下。把麥克風給他,大聲說出你的名字。

 

學生:卡特。你就一直重複剛才的過程,最終你會得到1

 

教授:我們會這麼做,但還是讓我們先一步步來。現在因為選擇68及以上的數的策略是弱劣勢策略,所以我們已經把它們剔除了,並且我們也排除了有人會選擇4667之間的數的可能。因為一旦我們剔除原賽局的劣勢策略,這些策略也就變成劣勢策略了。

 

所以我們知道沒人會選擇大於45的數,就好像46及以上的數都不存在,所以可能被選擇的最大數也就是45,而452/3大約是-誰幫我算下?30,對,大概是30。所以可知,選擇3045之間的數,這樣的策略在原賽局中並不是劣勢的,即使在剔除劣勢策略後,它們也不是劣勢的。但是當我們剔除原賽局中的劣勢策略,以及第一次剔除之後仍處於劣勢的策略後,它們就又繼續成為了劣勢策略。我不打算試著把這段話寫下來,但你們應該記到筆記裡面。

 

我們簡要寫一下這個結論,我們發現剔除掉3045之間的策略,不是僅僅憑藉我們自己的收益,不僅僅靠換位思考來推斷出,別人不會採用這些弱勢策略,在別人站在他人的立場上換位思考,並推測他人可能選擇什麼策略時,我們也進一步地換位思考。所以這是一個不斷換位思考式的過程,注意一下這裡的措辭。這是一個換位再換位思考的過程,說明我們也要換來換去思考。

 

接下來怎麼辦呢?我們已經知道會繼續發生什麼了。既然我們能剔除掉68及以上的數,那我們也能剔除46及以上的數,然後我們就能剔除掉31及以上的數,再往下我們可以繼續剔除,是多少來著?20以上的數,在2030之間的,而這會是一個三次換位思考的過程。選擇2030的策略一開始不處於劣勢,在第一次剔除劣勢策略時也不處於劣勢,在第二次剔除勢策略之後也不處於劣勢,但是在第三次剔除劣勢策略之後,就變成劣勢策略了。我想你們明白我的意思了。

 

那麼最終的結果會是怎麼樣的呢?最後的結果是什麼呢?這個過程會一直持續下去一直到1,直到只剩下1了。我們一直重複這個過程最後就剩1了。注意,一旦我們剔除了劣勢策略,我們已知有四人選擇了在4567之間的數,但是選擇3045的有不少,有多少人選了3045之間數?我敢保證絕對比這些多,我保證,多很多的。實際上選33的人是在這個範圍內選擇的,有很多人選了2030之間的數,所以我們已經涉及到分佈的問題了。然而我們發現這些策略,會因為某種推理而被剔除。

 

現在我還不打算告訴你們誰是贏家,我打算進行做一次更抽象的推理,讓我們討論得再深入一點吧!我們來討論下理性對賽局結果的影響,這稍微有點哲學的色彩。如果你是一個理性的參與人,我的意思是說,對於一個賽局中尋求個人收益最大化的參與者,僅僅出於理性,僅僅作為理性參與人,就會剔除大於67的劣勢策略,所以那四位選擇大於67的同學,我雖然不念出來你們的名字,但以後要注意啊!

 

但是接下來就不僅僅是理性那麼簡單了。還需要什麼呢?這位同學,你可以再說下嗎?再說一次你的名字,抱歉我忘了。

 

學生:尼克

 

教授:大點聲說

 

學生:尼克

 

教授:好的

 

學生:你需要假設你對手也是理性的

 

教授:很好。這也是有點拗口,但他的意思就是,理性的你,知道你的對手也是理性的,接下來呢?我自己已經是理性的了,我也知道對手也是理性的,我還需要知道對手們明白,他們的對手也是理性的。要剔除這個範圍,需要理性因素。可能有些人知道,這一點在最近社會科學界廣受質疑,人是理性的這個假設是否正確。想要剔除這個範圍,我首先得理性,我需要理性的知識,我們記理性為KR。並且我們需要知道別人也是理性的,進一步推理就是,我是理性的,我知道別人是理性的,我知道別人知道大家是理性的,我知道別人知道大家知道,人們是理性的。

 

說得再具體點,那些選67以上的四位同學,你們犯了個大錯誤。那選擇4567之間的四個人呢?這四個人應該怎麼評價?選4560的四位同學,我要說出他們的名字嗎?也許我最好不要這麼做。從他們四位當中我們能總結出什麼?麥克風可能到不了那麼遠,試試看能不能把麥克拿到那,盡可能朝前靠,請大聲點說。

 

學生:他們認為他們的同學的都很蠢

 

教授:沒錯。選擇4667的人,自身並不一定愚蠢,但他們可能認為剩下的人都很蠢。推論到這裡,人們不一定是愚蠢的,不應該認為別人是愚蠢的,只是你們認為他們是愚蠢的,抱歉,是他們認為剩下的人都是愚蠢的。為了使最後的結果到1,需要很多次的知道別人理性到知道別人是理性的推理。

 

有人知道這叫什麼嗎?如果我們假設有一個無限的,我知道你知道我知道你知道之類的序列,它叫什麼呀!信不信由你,他的術語是,在哲學上叫做共同知識。我不知道拼寫對不對,我看一下。共同知識是指,我知道一件事,你也知道這件事,你知道我知道這件事,我也知道你知道這件事,我知道你知道我知道這件事,以此類推,一個無限的迴圈。

 

但是如果大家都知道彼此是理性的,那麼最優策略就是1。有多少人選擇了1?我們來看看。環視一下教室,先別放下手,有多少人選了1?事實上你們中有很多人選了11是這個問題的最常見的答案,你們中很多人選了1,做的不錯,他們肯定已經他們肯定以為自己贏了。但是他們不是贏家。這個遊戲的最終結果,平均數大概是131/3,它的2/39,平均值的2/39,有人選了9,所以如果你選了9請起立。

 

以下同學選了9,不是這頁,選9的人的名單在哪?就在某頁上,抱歉,名錄頁碼實在太多了,找到了。以下同學選了9,如果你本人或者你是獲獎者的室友的話,請你們起立。張李星,張李星在嗎?如果在的話請起立。G•克裡斯多夫•貝勒拉,如果在的話站起來一下。威廉姆•菲謝爾在嗎?我不知道他來沒來。傑德•格裡克斯坦在嗎?如果傑德•格裡克斯坦在的話,請站起來。傑佛瑞•格林在的話請站起來。愛麗森•霍伊特在的話請站起來。愛麗森•霍伊特不在。有個叫約翰•羅賓森的,總共就這些人。站好,讓錄影機拍一下你們,每一個都拍一下。揮手,跟螢幕前的老媽打個招呼。我們為這些贏家鼓掌吧!

 

裘德確實帶來了一張5美元的鈔票,等我去取一下。這是5美元,我要把它撕成9份,但我會為此被捕然後被驅逐出境的。所以待會兒我會想辦法把它換成零錢,待會兒過來拿,你們都有權拿到5美元的九分之一。

 

為什麼經過一系列的推理,1不是最終的答案呢?為什麼選1不能獲勝啊?我們來問一下之前沒回答過問題的人,麥克風可以到後面嗎?把麥克風拿到你在的那排,看你能不能夠得到,很好,請起立,大聲說出來。

 

學生:1本該是獲勝的答案-

 

教授:再大聲一點

 

學生:如果大家都認為平均數會一直下降到1的話,1應該是最終的答案。但是由於一部分人選擇了,並不是說是錯誤的,但是卻高於平均值的數,就把平均數推高到了13

 

教授:沒錯,所以這樣一來,很好,所以這樣一來,謝謝你。要讓平均數到1需要很多條件的,不僅需要你們都是理性的參與人,不僅需要你們知道對方是理性的,而且必須知道所有人都是理性的。我的意思是,我知道你們互相都認識,因為你們都在耶魯大學念書。但你們都那麼熟悉了就會發現,並不是所有的人都是理性的,而且你很確定,並非所有人都知道你是理性,以此類推,需要很多條件才能使最終結果是1。實際上這個遊戲一直都沒有到1

 

前幾年的答案比這更高,今年還是比較低的年份。在2003,平均值是18.5;在2004,是21.5;在2005年,我想這個班的同學並不互相信任,因為平均值是23。今年是131/3,我認為今年比以前做得好多了。順便提一下,有趣的是,我就是順便提一下,班級中位數也是9,中位數正好也是遊戲的答案。

 

那麼現在我們再重新玩一次,我們沒有足夠的時間完整的來一遍,雖然我都發完紙了。請你在不被同桌知道的情況下,寫下一個數字,不要和別人討論,這算違規。寫下一個數字,如果你們沒有拿到我發的紙,就寫在你們的筆記本上寫下一個數字,都寫完了嗎?下面請大家來舉手。有多少人,錄影機會轉過來對準你們,多少人選了大於67的數?看樣子班裡面有幾個搗蛋鬼啊!多少人選了大於20的數字?多少人選了大於10的?多少人選了510之間的?多少人選了0?抱歉,選15的。

 

除了上次選1的人,多少人選了比你上次選擇的數還低的數字?把手舉一會兒,幾乎所有的人都選的比上一次低。為什麼?為什麼會出現這種情況呢?我猜這次的平均數字大約在3或者4,甚至可能更低。為什麼我們這次選的數字會變小呢?穿綠色衣服的女孩子,很抱歉我沒記住你的名字。

 

學生:因為我們剛剛上過課,你告訴我們選大數的人是不理性的。

 

教授:這對了一半。你們都明白了不應該選擇一個較大的數。還有別的原因嗎?我們換個人吧!那個在揮手的人,戴帽子的後面那位,就是你。

 

學生:因為我們在重複上次的遊戲

 

教授:沒錯,我們重複了這個遊戲,我們重複了這個遊戲,重複了又怎麼樣了呢?在我們講了這麼多之後,有什麼不同了嗎?我來推測一下吧!我覺得因為不僅你們自己玩這個數字遊戲玩得更好了,你們也瞭解到周圍的人也玩得更高了。對這個遊戲的分析,不僅讓每個人都更老練了,也使你們更瞭解別人老練的程度,並且你知道別人知道你知道如何玩好這個遊戲。

 

從中我們得出的主要結論是,不僅你要站在別人的立場上,思考別人的收益是什麼樣的,你還要站在別人的立場上,思考他們在賽局時有多老練。並且你需要考慮到,他們認為你有多老練。你還需要考慮到他們認為,你認為他們認為你在賽局時有多老練。這個是知識層面的問題了,這些知識層面會導致不同的結果。再具體點說,如果一家公司在和它的競爭對手競爭,可以肯定其競爭對手一定很老練,這家公司當然也很老練啦!如果一家公司在和客戶賽局,比如發放說次級貸款,可能假設不是那麼完備。把賽局理論運用到實際是很重要的,本學期我們會不斷學習類似的案例的。

 

現在我還有5分鐘,還有5分鐘下課對嗎?現在我們順便說說其他的。我們一直在討論知識和共同知識,現在做一個小小的實驗。所有人都坐在自己的位子上,我找來兩位助教,請艾爾和卡佳來到講臺上來。我想讓大家明白,共同知識並不是像我寫在黑板上的,是一個想當然的概念。

 

請站到講臺上來,麥克風隨便放一下就好。我們的兩個助教在這裡,事實上是兩個助教主管。把臉朝前,不要看到我的動作。我要給他們倆戴上帽子一個給艾爾,一個給卡佳。你們倆站在這吧!這樣大家都能看到。現在你們都能看清這兩頂帽子。如果他們轉過來,就也能看到對方的帽子。現在問一個問題,我這樣說,這是共同知識嗎?至少有一個人戴著粉色的帽子,這是共同知識嗎?這算共同知識嗎?我說這不是共同知識。

 

我們已知什麼?我已經告訴你們了,艾爾只知道卡佳戴著粉色帽子,所以艾爾確實知道,至少有一個人戴著粉色的帽子,而且卡佳也知道艾爾戴著粉色的帽子。他們看起來有點傻,不過沒關係。注意一下。艾爾不知道他頭上的帽子是什麼顏色,所以儘管他們都知道,儘管至少有一人戴粉色帽子是相互知識,艾爾不知道卡佳看到的是什麼顏色的帽子,所以艾爾不知道卡佳知道這裡有一頂粉色的帽子。事實上,從艾爾的角度看,這很有可能是頂藍色的帽子。但是他們都知道,至少有一個人戴著粉色帽子,至少有一頂粉色帽子是相互知識。但艾爾不知道卡佳知道他戴著粉色帽子,卡佳也不知道艾爾知道,卡佳戴著粉色帽子,他們每個人的帽子可能是藍色的呢!

 

所以要注意下,共同知識,謝謝你們二位。共同知識的定義是嚴格的,謝謝。共同知識有嚴格的定義,相互知識並不是共同知識。共同知識並不只是我知道什麼,還有我是否知道別人知道,我知道別人知道……以此類推。儘管這個例子很簡單,你們也可能會認為,這很明顯嘛!這就是共同知識。然而教室裡有一頂粉色帽子並不是共同知識。誰有年齡較小的兄弟姐妹的,粉色的帽子就送給你了,各位週三見啦!

 

 

講座3-迭代剔除及中間選民定理 

 

 

 

 

 

 

 
第三講概述:
我們將上堂課提到的主要概念,即迭代剔除劣勢策略做應用,來分析在選舉中候選人可以如何選擇自己的政治立場。然後思考用這個經典模型來描述實際政治進程的效用為何,以及我們可以如何建立並改進它。在本課的最後,我們引入一個新的、超出迭代剔除範圍的概念。思考我們對於其他參與者將有什麼行動的信念,然後自問,在已知的信念之下,對我們來說,選擇何種策略才是最佳的?
 
閱讀作業:
杜塔著《策略與賽局:理論與實務》第二章第3節;第三、四章
喬爾•沃森著《策略:賽局理論簡介》第六至八章
迪克特及奈爾巴夫著《策略性思考》第三章,1-3節
 
資源:
 
講座3-迭代剔除及中間選民定理
2007年9月12日
 
Ben Polak 教授:上一講我們著重討論了一個知識點,我還沒說它的名稱,用術語說。我們講了剔除劣勢策略,觀察某個賽局,先找出劣勢策略,剔除劣勢策略,再繼續審視這個賽局,找出哪些現在也成了劣勢策略,然後剔除它們。如此反覆進行,這個過程被稱之為迭代剔除劣勢策略,巴裡的書要是叫這個名字可不高明啊!想要賣到250美元,我們得想個更好的名字,因為這個名字太枯燥了。但沒關係。
 
迭代剔除劣勢策略揭示了以下過程的主旨,站在對方的立場上去換位思考,推測對手的行動策略,同時想像對手也會站在你的立場,推測你的行動意圖,如此反覆進行。透過上節課的賽局,我們可以看出,這是個非常重要的概念。同時我們也發現過度照本宣科也不好,有時他會導致你對於問題的過度探究。
 
正如我們上次玩的數字遊戲。最優選擇,最後獲勝的答案,有時不會繞那麼多彎子。我們同樣可以發現,在某些賽局中,不是所有的賽局,迭代剔除劣勢策略最終會導致唯一的選擇,在數字遊戲中最後就只剩1了。所以再次強調,站在我們自己的立場上說,我們不應採用劣勢策略,應該剔除它們,其他人也會這麼做,因為其他人也不會採用劣勢策略。先剔除劣勢策略然後重新觀察這個賽局,尋找是否有新的劣勢策略,剔除他它們,再重新研究等等。我能把那個過程寫下來,在上次的賽局裡就是這樣的,這樣比較容易找到最終結果。
 
這裡有一個竅門,在剔除之前試著找出所有參與人的劣勢策略,然後再剔除它們,重新審視賽局,再次尋找所有參與人的劣勢策略,再剔除它們,這樣可以讓你免於陷入困境。今天的課程會不那麼抽象,如果你們願意的話,我想在這裡列舉一個應用案例,一個政治領域中著名的立場選擇問題。
 
一個在政治模型下的案例。這個案例是這樣的。假設有兩個候選人,而這兩個候選人為了選舉,必須確定自己的政治立場。
 
他們是參與人,策略是什麼呢?就是他們要從一系列政治主張中,選擇一個政治立場。簡單點說,一系列政治主張中共有10個立場,這10個立場我們分別稱為1、2、3、4、5、6、7、8、9、10。很複雜,這是什麼意思呢?這個賽局我們還沒描述完整,這是什麼意思呢?最靠近這裡的立場代表左翼分子的立場,而這邊則是右翼分子的立場。被講臺擋住了嗎?讓我們移開。
 
你們能想像極端左翼人士什麼樣嗎?我猜這些人呢,他們只吃水果,認為樹也有投票權。這些則是代表極端右翼的立場,他們認為窮人沒有投票權,而且他們剝削移民。我是移民,所以我要小心點才行。這兩個候選人需要選擇自己的政治立場。我們假設,本案例純屬虛構,我們現在假設,每一個政治立場都會有10%的得票,每個立場都會得到10%的選票,他們平均分佈。
 
我們假設,選民會投票給離他們最近的候選人,選民會投給最近的候選人,就是最接近自己的的候選人。我們需要假設一個解決平局的方法,我們確實也需要解決平局問題,出現平局時選票會分攤,即該立場的選票會被平均分攤。如果是平局,一半的選票劃給其中一個候選人,另一半給另一個候選人。現在這是個賽局,有了參與人了,就是候選人;有了策略了,就是政治立場;還缺少什麼?還缺少收益,對吧?我還沒有提到收益。在這個賽局中如何確定收益很重要。我們假設這個賽局的收益是,候選者希望盡可能最大化獲得的選票。
 
但這還不是這個假設的全部內容。我們假設他們真的非常想獲勝,獲勝會帶給他們巨大的收益,失敗則一無所獲。我們來再進一步假設,最大化怎麼拼?就用max代替吧!假設他們想要最大化自己的得票數,這麼假設沒什麼不妥,因為你可以認為獲得更多的票數,意味著你會獲得委任機會,或者把它看成是總統大選的初選。獲得更多的票數,對你下一輪的選舉起到積極作用,所以我們假設他們會盡可能地最大化自己的得票數。
 
我們都想知道這個賽局會怎麼進行,這是一個有普遍性,也很重要的賽局。好,先看看我們都學了哪些知識點。首先想到的是,這裡的策略是什麼?有10個策略可以選,這裡有劣勢策略嗎?這裡有劣勢策略嗎?讓我們來看一下。助教們請準備好話筒。這裡有劣勢策略嗎?那位穿藍衣服的先生,站起來大聲說。
 
學生:1和10 是劣勢策略
 
教授:你叫什麼名字?
 
學生:斯蒂文
 
教授:斯蒂文說1和10,我們稍後說10。你說得很對,我們稍後說10。他說到立場1,也就是策略1,即選擇最極端的左翼立場是劣勢策略。那麼哪個策略優於它呢?斯蒂文,你來大聲回答一下。
 
學生:策略2
 
教授:例如策略2。我們推測策略2優於策略1,這個是推斷。這裡要注意,策略2優於1意味著什麼?意味著選擇立場2,會比選擇立場1獲得更多的選票,無論另一個候選人如何選擇。這不意味著立場2會擊敗立場1。
 
讓我們看看斯蒂文的推測對不對。首先,先來看看如果你選擇立場1和2,在你對手選擇不同立場時,你分別能獲得多少選票。比如說,我們現在來驗證一下,策略2是否優於策略1。當我們這麼做的時候,也會明白收益會起到怎樣的作用。不妨來看看對手選立場1的時候。假設另一個候選人選擇立場1,另一個候選人選擇立場1,我們來計算當對手選立場1時,我也選立場1獲得的收益,我們再計算當對手選擇立場1時,我選擇立場2獲得的收益。
 
讓我們算算看,有人能說一下嗎?如果我們都選擇立場1時,我能獲得多少選票?很簡單對嗎?兩人平局,各得50%。如果我選立場2,而對手選立場1呢?對手會得到立場1的選票,而我得到剩餘的90%選票,在這種情況下選擇立場2比1好。但是我們還沒有說完呢!我們還要考慮對手的其他選擇。
 
假設他選擇立場2,當我選擇立場1而對手選擇立場2時,或者如果我們都選擇立場2,我的收益會是怎麼樣的?我選立場1對手選立場2,我收益是什麼?我得到選擇立場1的10%選票,對手得到剩餘90%的選票,對嗎?所以我只有10%。如果兩人都選了立場2呢?各得50%選票,皆大歡喜呀!綜上所述,選擇立場2確實比1好,每個人都滿意嗎?我們證實了這個選擇更好,而且這個策略更好,我們接下來繼續計算。
 
對手選立場3,現在來計算我選立場1對手選立場3,或者我選立場2對手選立場3的情況。如果我選立場1,對手選立場3,我能獲得多少選票?我會獲得所有立場1的選票,和立場2一半的選票,就是15%。如果我選立場2他選立場3,我會得到20%的選票,立場1和立場2的選票都歸我,所以是20%。大家都明白了吧?讓我們再繼續,看能不能找到規律。如果我選立場1對手選立場4,與我選立場2對手選立場4比較。如果我選立場1對手選立場4,我會獲得多少選票?我會得到立場1和2的全部選票,就是我得到20%的選票,而她得到剩下的選票。如果我選2她選4呢?我會得到立場1和2的選票,以及立場3的一半選票。這樣一來,我得到25%的選票,依次類推。
 
我可以就這樣一直算下去,但還是到此為止吧!因為再這樣下去會很無聊。我想你們已經可以看到其中的規律了,規律是什麼呢?有規律可循嗎?有人知道嗎?有人舉手了,把話筒給他,把話筒給那個白衣服的男生。站起來,大聲說出你的答案。
 
學生:立場2永遠優於立場1
 
教授:立場2永遠優於立場1,除了這個應該還有其他發現,你說的對,但是這裡有什麼規律,把話筒給這裡的人。
 
學生:無論如何,選擇靠近立場5的收益,總是比遠離立場5的收益要好。
 
教授:這不是我要找的規律,看看這些數字,15%、20%,還有20%、25% 等等,有什麼規律嗎?斯蒂文你來說吧!
 
學生:如果你的對手不選1立場或者2,你選擇立場2總會比選擇立場1多得到5%的選票。
 
教授:完全正確。所以忽略前兩個立場,因為前兩個立場有點古怪。我們選立場2總比1多獲得5%的選票,無論對手如何選擇。如果你願意的話,你可以依次檢驗剩下的6個立場,結論是一樣的。你會發現斯蒂文說的很對。從這裡開始,選立場2總會比選立場1多獲得5%選票,事實上,會以5%的差額遞增,事實的確如此。我們可以得出結論,立場2優於立場1,或者更進一步說,立場2嚴格的優於立場1,策略2嚴格優勢於策略1。
 
還有哪個是劣勢的呢?斯蒂文已經說了立場10是劣勢策略,我不想再花時間證明了,每個人都可以看出這他們是對稱的。稍等一下,大家都應該能看出來同樣的,立場9優於立場10,對嗎?很明顯對吧!和剛才原理是相同的,就是方向相反。同樣,立場9嚴格優勢於立場10。我們不是說選立場2會擊敗選立場1,選立場2能贏立場1,或者選立場9能贏選立場10。我們說選立場2總是優於立場1,無論對手如何選擇,選立場9總是優於立場10,無論對手如何選擇。那個人有疑問?把話筒給他,站起來大聲說。
 
學生:我想你之前已經定義過了,但是我在課本裡沒有找到「嚴格」的定義。
 
教授:好的,你在講義裡能找到的,我記得講義裡好像講了,以防萬一,我們課堂上有兩個定義,在其中一個講義裡面。這裡總結出立場1劣於立場2,立場10劣於立場9,還有其他的劣勢策略嗎?讓我們看看立場2是不是劣於立場3。我忘記你的名字了,你叫什麼名字來著?
 
學生:蘇蒂帕
 
教授:蘇蒂帕之前提到過,我們應該選更靠近5的立場,而立場3比立場2更靠近立場5。立場2劣於立場3嗎?有人知道嗎?請舉手。有人舉手了,把話筒給那位女士。
 
學生:一旦你剔除了劣勢策略,再次審視這個賽局時,立場2劣勢於立場3。
 
教授:你比我們講的超前了,很好,我們會講到那裡的,暫時說到這裡。但是如果我們不剔除任何策略呢?讓我們看看,我們來檢驗一下。那我們不妨來檢驗看看,如果對手選立場1我收益如何。我選立場2他選1,我得90%選票,要是我選立場3對手選1呢?我會少獲得5%,而得到85%的選票,所以說立場3不優於立場2,3不優於2。因此,如果對手選擇立場1,我選立場2會比選立場3得到更多的票數。因此說立場2劣於立場3,那個女生,我忘了她的名字了。
 
學生:克裡斯汀
 
教授:克裡斯汀指出,請再把話筒遞給克裡斯汀,請你再說一下剛才的觀點。我們知道選立場2並不是劣勢策略,它並不劣於選立場3,但是…但是什麼?
 
學生:,當你剔除劣於策略2的劣勢策略1,或者說立場1處於劣勢,當你剔除策略1和10之後,2就變成劣勢策略了。
 
教授:克裡斯汀說的是,即使選擇立場2不是劣勢策略,如果我們迭代剔除劣勢策略。我們剔除掉了劣勢策略,然後再來回頭看看還有沒有劣勢策略。我們需要注意的是,我們並沒有說要剔除立場1或者立場10的選票,雖然我們希望能這樣。我們只是想,我們要說的是,我們知道候選人不會選擇立場1,同樣也不會選擇立場10,因此我們要剔除這兩個策略,但是選票還是這樣分佈的,我們來看一下。
 
所以我們說到關鍵了。如果我們剔除劣勢策略1和10,那麼策略3優於策略2嗎?我們再來看一下,我們來檢驗一下,我們先看看我選立場1,我們先從選立場2開始吧!如果雙方都選立場2,則各得50%選票,我選立場3對手選2的情況下呢?我選立場3的收益是多少呢?有人知道嗎?我選立場3對手選立場2的收益是什麼?80%的選票,選立場2的人會得到立場1和2的全部選票,選立場3的候選人會得到剩下的選票,所以立場3會得到80%的選票。如果對手選3而我選2,我會得到立場1和2的全部選票,一共20%,雙方都選立場3的收益,就是各得到50%,握手言和。
 
所以選擇立場3更好。對手選4而我選2的收益是什麼呢?對手選4我選2,我能獲得多少選票?就是立場1和立場2的全部票數,加上立場3票數一半,一共是25%。當對手選4我選3的收益,就是立場1的選票,加上立場2和立場3的選票,一共是30%,立場3收益更多。再算一個。對手選立場5我們選立場2的收益。我把它推上去一點。對手選5,我的收益就是立場1加上立場2和立場3的全部選票,一共是30%。對手選5我選3的收益呢?就是立場1加上立場2以及立場3的全部選票,再加上立場4的一半選票,一共是35%。
 
至此你會發現,後面的情況也是一樣的。如果我不怕麻煩,我能一直這麼寫下去。我們發現選擇立場3總是比選擇立場2使我多獲得5%的選票,在對手選更靠後的立場的情況下。斯蒂文以前曾指出過相同的問題,我又忘了你的名字了,抱歉啊!
 
學生:克裡斯汀
 
教授:克裡斯汀說的很對。一旦我們剔除了策略1和10,一旦我們意識到不會有人選擇這些立場時,我們會發現,選立場2或9可能也不是個好主意了。策略2和9本不是劣勢策略,但是當我們明白無人會選立場1和10的時候,它們就變成劣勢策略了。好吧,現在我們講到哪了?我們講到哪了?這個討論會怎麼結束呢?
 
讓我們回到最初的賽局。我們已經知道無人會選立場1和10,因為它們是劣勢策略。我們明白了-一旦我們知道了無人會採用那些策略時,那麼也沒有人會選立場2和9,這個賽局最後會怎麼樣呢?讓我們放慢一點。在第一次推理中,1和10是劣勢策略,我們知道無人會採用它們,我們就不會去採用它們,但要記住選票還在,我們僅僅剔除了這些策略。我在第二次推理上畫兩個叉,立場2和9,然後我們排除立場3和8,然後我們排除-我們應該也能排除4和7及5和6,如果我們按照這個程序迭代剔除劣勢,不斷回頭看看那些策略是劣勢的,最終將只剩下立場5和6。
 
所以從中我們總結出來,候選人會選擇5和6。在選立場5或是6二者中有劣勢策略嗎?沒有,它倆打個平手,對吧!所以到最後,這個過程,即迭代剔除,我們簡寫成:it del,最終只剩下了策略5和6了。
 
這只是一個簡單的案例罷了,我的意思是說,我希望這只是個簡單案例,讓我看看那裡,大家都明白了嗎?這應該並不難。與此相關的東西,事實上並不難,實際上一點也不難,有關的東西都是相關聯的,這個是和現實世界緊密聯繫的,實際上這是一個著名的政治學模型,有人知道這個模型叫什麼嗎?最終可能的結果是什麼?預測最終結果是,候選人會被擠到中間立場,他們會選擇與對手相近的政治立場,且相當的中立,有人知道它叫什麼嗎?先保留你的想法,後面的同學,大點聲說。中間選民定理。謝謝你。
 
讓我們換一塊黑板,這一塊就行。預測的結果是,候選人會擠在中間。在政治學裡,這被稱為中間選民定理。它之所以叫中間選民定理是因為,處在中間位置的選民,比如這個案例中立場5和6,實際上他們不止左右了選舉結果,而且還決定了那些政策可以施行。它怎樣作為現實世界的一個預測呢?在美國歷史上就有一個案例,此案例中,中間選民定理非常奏效,那是些相當古老的案例,它們發生在你們出生之前,不過我們還是提一下。
 
我想如果你們今天回家去看甘迺迪和尼克森1960年競選的錄影,美國學生幫我確認一下,是60年吧?我記得是在60年,確實在1960年。在甘迺迪和尼克森兩人中,如果你要是看過錄影帶的話,聯想到甘迺迪在當今的聲譽,你會對他當時的保守姿態深表詫異。他們實際上都聚集在中間立場,而八年後尼克森似乎也學到了教訓。如果你回顧68年尼克森勝出的那次選舉,尼克森在那些表達他政治主張的選舉錄影裡看起來,作為一位共和黨人士的他卻並不保守,這一次他們又都擠到中間立場上了。有人說92年克林頓也採用一樣的伎倆,他將民主黨向右翼靠近,也就是說變得中立,以此來拉攏中間選民並獲勝。
 
因此從美國歷史上的選舉案例裡看,中位數選民定理非常奏效。我們一會再深入討論這個問題。在此之前,我再來列舉一個模型,是經濟學裡面一個完全類似的模型,已經有人在研究了。它在經濟學的應用是產品植入,這是傑克正在研究的領域。
 
在產品植入領域裡,假設你考慮設立一個加油站,你會想,如果加油站能均勻覆蓋城鎮每個角落,或者遍佈整條公路那該多好,這樣無論你在哪裡需要加油時,附近就會有一個加油站,那該會非常的方便。但很不幸的是,加油站,如我們所知,它們一般都設在相同的地點,他們趨向設立於同一個路口,對吧!為什麼呢?因為他們試圖,他們都為了拉攏附近客源,或是那些剛剛耗完汽油的顧客而相互競爭,它們透過擠在一起,避免自己因為選址的問題而被淘汰出局。
 
我說的有點快,但是我們以後會再次回顧這個問題,並作深入的研究的。在政治學中,這是關於候選人集中趨向中間立場,從而拉攏更多立場相近選民的理論。在經濟學中,他表現為商業普遍集中,以試圖爭取附近的客源。與之有關的一個人,叫安東尼•唐斯,他寫於1957年的一本政治學著作中,對此理論有所涉及。在經濟學領域裡,有一個叫霍特林的人,他在1929為此寫過一篇論文。在政治學裡,他們稱之為同時期發現。我覺得1929年還是有點早了,但也無所謂了。
 
接下來我想要做的事,定期地在課堂上建立模型,然後分析這個模型。我們使用賽局理論來分析一下,我希望大家能得出我們的假設是否合理。我們如何看待這個模型的優缺點呢?我想你們應該考慮下,你相信這個模型嗎?這是一個不錯的政治學模型嗎?它缺少什麼?讓我站下講臺一會,這樣我可以鼓勵大家都參與到討論中來。你們有多少是政治學專業的?政治學專業的同學請舉手。
 
順便問下,你們這些政治學專業的學生中,有誰以前聽過這個模型嗎?有一些人聽說過,那這個模型缺少什麼?你們都生活在美國,你們生活在民主社會中。你們中的人並不全都生活在美國,但是你們中許多人生活在民主社會中,對此你們有什麼想法?我們這個模型缺少了什麼嗎?讓我們聽聽那位女士說。
 
學生:每個立場的選民並非按10%均勻分佈
 
教授:有一點使我們建立此模型的假設很牽強,即選民們不是均勻分佈的,讓我回到講臺上記一下,雖然這樣很累,但我多走幾個來回吧!被忽視的因素,或者說錯誤在於,在現實生活中,每個立場的選民數並非是均分的。好了,還有別的嗎?我們來輪流依次討論這些問題。我能聽聽那位同學說嗎?抱歉,這樣做對裘德不方便,讓我下來這邊吧!我下來搜集答案,然後回到講臺。
 
學生:這個模型沒有考慮到,不同候選人所在黨派的名額數有差異。
 
教授:好,這裡涉及到名額的問題。這裡我們假設人人都投票,這對嗎?但是事實上,非人人都投票,不投票也是一種策略,提醒我寫下這一條,不投票,別忘了要提醒我啊!穿黃色衣服的那位先生。
 
學生:在初選和大選中也存在著區別
 
教授:好,讓我們假設,我們把思維跳躍到某一次選舉中,至少在美國社會裡,無論正誤,我都有權發表自己的言論。現在正有很多初選進行中,在所有的州都會進行初選,有些州名你甚至都沒聽說過,或者你只聽過它周圍的州的名字。還有別的嗎?我們能不能,另外一個麥克風在哪?請穿綠色上衣的女士來回答。
 
學生:美國選民經常根據候選人的性格,而非政治立場來投票。
 
教授:所以不僅僅是立場,換句話說,就是,如果我說錯了請糾正,換種說法就是,我們把政治假定為單一維度的,非左即右,然而它還涉及其他方面,比如性格問題。即使政治事務的處理也不是單一維度的,它可能是有一個方面是關於環境的,而另一個方面是關於外交政策的,第三個方面也可能是再分配政策,那是一個重要的觀點。還有更多的看法嗎?
 
學生:此模型可能不適用於兩個以上的候選人
 
教授:另一個問題是,我假設只有兩個候選人,我們知道在一些選舉中有三個候選人。例如,納德也參與到了那次大選,我猜他也在另外一場選舉中,但很顯然他也參加了2000年的大選。順便說一句,我不認為某種程度上說,有三個選舉人是一個笑話,這是由於一些由來已久的問題造成的,因為不投票也是一種選擇。原則上,在2000年那場大選中,應該有四個選舉人,因為你可以投出四種選票,當時你可以這樣投票。你可以投給高爾、布希、納德,或者投棄權票,我留給你們自己去考慮,投給誰等於棄權?有人回答嗎?我還有個想法,雖然有點無關緊要,但也是顯而易見的。有個第一次發言的同學,艾爾幫我個忙,幫我遞給他一個麥克風。
 
學生:考慮到人們關注的東西都不一樣這個實際情況,每個最靠近立場6的人,未必把票都投給選擇立場6的候選人了,這可能只是巧合。
 
教授:你說的沒錯,儘管這可能也是一個維度的問題。我有一個不同的想法,讓我解釋一下,我認為這很重要。一個候選人在整個大選中可能說,我是個中立的候選人,我的立場是5,但你不一定就相信他/她的說法。你可能掌握著候選人的記錄,儘管那個候選人聲稱自己的立場是5,你心裡很清楚,那個候選人的立場實際上是1或10,對嗎?因此除非候選人能保證堅定一個立場,否則他們輕易宣稱自己是中間立場,反而將會帶來麻煩。
 
接下來我們再來分析一個案例,就是布希跟高爾競選總統的案例。我們都知道總統布希,那時候應該還是總統候選人布希,說他自己不是激進派,他是個有同情心的保守派,然後你們竟然相信他了。我真的想不明白,是不是因為他在德克薩斯州任職期間的政績,使他看上去像個保守派。再或者說,現今的黨內初選時,你會發現不同風格的候選人,無論他們是民主黨的還是共和黨,都在尋找適合自己的政治立場,但你們也會發現,幾乎所有候選人都有政績可尋,並不是所有人都相信希拉蕊•克林頓,像她自己說得那樣,是個中立派。並不是所有人都相信,前麻塞諸塞州州長會像他看上去那樣,是個保守派。所以說你自己選什麼立場不能僅憑喜好。
 
我得把這些寫到黑板上,不然我就忘了。大家一起來幫我回憶一下,有多位候選人,實際情況下候選人不只有兩個;存在棄權票,這也是很正常的。還有就是,候選人未必能夠堅守他的立場,也就是說選民未必相信你的立場。我要指出的,是這與你無法執行相應政治策略是相關的。還有其他因素,比如黨內初選,多維度問題,也就是多維分析,我把所有要點都寫下了嗎?我想應該大概就這些了。
 
已經有很多因素了。當我們再仔細分析這個模型時,我們發現之前的分析漏掉了很多因素,很多因素都沒有被加入到模型裡,以後我們考慮問題要更嚴謹一些了。有人可能會說,看看我們建立的模型,它忽略了這麼多東西,所以這個模型沒有任何意義,或許你們會說,根本沒必要建立這個模型。你可能會更進一步說,建模的時候總會忽略一些因素,所以乾脆也不要建模了,我覺得這樣推理是不成立的。我覺得合理的結論應該是,我們建立模型的目的,是為了更好地描述事實,激發靈感。這個案例告訴我們的是,候選人都擠到中間立場,以拉攏更多選票。
 
但是,當然了,模型是由重要的事實抽象而來的。我們接下來該怎麼做呢?好吧,那我們就來完善這個模型吧!給這個模型加入新的約束條件,看看會不會得到不同的結果。如果是再分析原因,你們從最原始的模型開始,加入約束條件來豐富這個模型,然後檢驗結果是否有變。這能幫助我們解釋,為什麼在不同條件下結果是不同的。今天這一講我要說明的是,模型總是抽象的。你建立好模型要看看有沒有疏漏,然後添加應有的約束條件,檢查它們對結果是否有影響。如果有,是如何影響的。
 
我們再進一步來分析。首先想到的就是,現實中選民是不均勻分佈的,這的確是毋庸置疑的。但事實上,就算我們讓選民分佈更符合實際情況,比如說是按鐘形分佈的,但這實際上對結果沒有什麼影響。縱使它是現實,但它對結果沒有影響。我們就可以說這個是次要條件,因為它的變化不會引起結果的改變。
 
那麼多個候選人的約束條件呢?顯然這個有很大的影響。我們知道在92年和2000年,有多個候選人參與了大選,還有棄權票對結果也有很大影響,我們來看看這些條件會不會影響結果。這個條件的分析是第一個習題集的內容,你們回去自己分析一下。我們回到最初的模型,然後加入第三個候選人,看看結果會怎麼樣,你們就會知道這會不會改變結果了,我就不告訴你們結論了。
 
堅守政治立場,這一點也很重要。通常候選人很難讓選民相信,他們是左派、右派或是中間派。我舉個美國歷史以外的案例吧!那是發生在英國的事情。在97年,是八九十年代的事情,英國工黨在選舉敗選,而且是連年落敗。每次選舉的時候,他們都會聲稱,我們不是一個左翼政黨,我們現在是中間派,但是選民都不相信他們。
 
而托尼·布雷爾代表的工黨,在97年大選中獲勝,他在選舉中提出了新工黨政策。他成功讓選民相信,工黨是真正意義上的中間派。他採用的是,在英國,參選人必須提前公佈自己內閣政府在未來五年的財政計畫,所以他就用了當時執政的保守黨的財政計畫,作為未來五年的財政計畫公佈給民眾。他說這些計畫就是他的執政計畫。我現在就宣佈,這是未來五年的財政計畫。那些政策跟保守黨的如出一轍,他不只是選了一個臨近保守派的立場,他選的就是一個保守派的立場。這就跟某些在座的同學說一樣,選舉的重點往往在其他方面,比如說性格或者其他方面。在某個方面取勝了,那就大獲全勝了。
 
儘管如此,儘管我列舉了一個歷史上的例子,我們還是要回到課堂上來。我們接下來要來探討一個政客不能自己選立場的模型。但是當然你們可以提前獲知他們的立場,我們會講到這個模型的,我們以後再討論這個。另外兩個約束條件,初選和多維度,這二者都是很有現實意義的,我們在這門課上就不去探討它們了。但是如果你們選修了政治學專業的,有關投票與選舉模型的課程的話,你們會發現這兩個因素都可以模型化,而且都會有非常詳細的介紹,甚至會有實際經驗表明,多維度在選舉中是多麼舉足輕重。
 
那些都是政治科學的重要內容。我想鼓勵你們選一些更深入的課程,儘管那是別的學院開的課。大家都理解有關迭代剔除的內容了吧?我們在相對抽象的背景下探討迭代剔除,其實也沒那麼抽象。比如上一講,我們做的選數字的遊戲,然後我們討論了漢尼拔將軍入侵羅馬,現在我們又把這個理論運用到選舉中,我認為迭代剔除已經講的差不多了。
 
所以接下來我想換個話題了。我們來介紹一個新的理論工具,這門課要經常用它們。我們會不斷引入新的工具,然後學會如何運用它們,接下來看看從中我們學到了什麼,然後我們又引入另一個工具,所以現在我要介紹一個新的工具。之前的問題還有疑問了嗎?大家都聽懂了嗎?看來是都聽明白了,大家確定都聽懂了是吧?好了,那我就不再講迭代剔除了,我要向你們介紹一個新的話題。我先擦一下黑板,一會可能要用到的。
 
有一條關於建模的準教訓。對於經濟學者,你們那些主修經濟學的,應該經常問自己,出現什麼問題了?對於主修歷史或者政治學的同學,就需要多考慮一些問題了。你們要多問問自己為什麼要建模?我們能從這些模型中學到些什麼?好了,我們講下一話題。下一個分析賽局的內容,被我們稱為最佳對策。我們舉個例子來開始。
 
這是一個只有兩個參與人的很簡單的賽局。參與人I有三個策略,上中下;參與人II有左右兩個策略;收益是這樣的。這確實不太有意思,他們只是些數字罷了。(4, 2) 和 (2, 3),還有(5, 1)、(0, 2)、(1, 3)、(4, 1)、(4, 2) 和 (2, 3)。首先,我們先用已經學過的知識來分析這個賽局。
 
哪個參與人有劣勢策略嗎?有人回答嗎?我說沒有參與人存在劣勢策略,我們來驗證一下。例如說,你們可能認為選下是個劣勢策略,但仔細觀察後你會發現,參與人II選右時,選下要比上更好;參與人II選左,選下比選中更好。類似的,我們也得出右也不是劣勢策略。因為參與人I選上時,選右比選左好。選左也不是劣勢策略,因為參與人I選中時,左是最佳策略,以此類推。
 
當你從頭到尾仔細分析過之後,你會發現這裡沒有劣勢策略。所以之前講的,不要採用劣勢策略和迭代剔除劣勢策略,在這裡就不奏效了。因此,對於這個賽局你也無從下手了,儘管這是個簡單而直接的賽局。現在假設你就是參與人I,你認為你應該怎麼選擇呢?你是參與人I的話,你該怎麼辦?還是請大家舉手表決吧!
 
看仔細了,再好好看看這個賽局,不准不舉手哈!有多少人選上?選上的請舉手,選上的現在請舉手啊!好了,你是管理學院的學生吧?你可以把手舉起來。哦,你是說自己數學不好啊?好吧,你去年不是學了會計學嗎?沒人選上嗎?沒有人選上,那好吧!有誰選中?只有一個人選中。多少人選下?哦,我的天啊!那麼多人選下呀!那我們來分析一下吧!
 
如果知道參與人II會選左,你們怎麼選?如果你們突然得知參與人II要選左了,你們會怎麼選呢?大家都知道5大於1,5也大於4,所以選上是-以後我們就要用術語來說了,選上是左的最佳對策,大家都看明白了嗎?選上是對手選左時的最佳對策。那選什麼是對手選右的最佳對策呢?選中是右的最佳對策,是吧?因為4大於0,4大於2,所以選中是右的最佳對策。有趣的是,你們都選擇下,可是選上是左的最佳對策,而選中是右的最佳對策。
 
我們把這個問題變得複雜點。加入你給別人打工呢?你們從耶魯大學畢業後可能會選擇創業,但大多數人會和我一樣,畢業後會給別人打工。假設你在工作中遇到了這個賽局,你選擇了上,你的老闆找到你,很嚴肅的看著你,校長裡克·列文或者別人很嚴肅的看著我,問我為什麼要選上,我該怎麼解釋?我說,哦,我選上是因為,我認為對手會選左,我對我選上做了解釋,我認為對手應該會選左,這樣我認為選上是合理的,但那樣行嗎?那樣最多能保證我不會被炒魷魚,至少在當時不會。
 
類似地,如果我選了中,然後校長裡克·列文走過來問我,為何你選擇中?我說,我選中是因為,我認為另一個人會選右,並且選中是右的最佳策略。同樣的,我可能有幸保住了工作,看起來我好像解釋了為什麼選中,但是你們都選了下,絕大多數的人都選了下,選下就很有技巧性。我該如何解釋我為什麼選下呢?我能找出選擇下的理由嗎?你們都選擇了下,我現在是你們的老闆了,你們為什麼選下?有些人到現在還沒發過言,把話筒遞給你前面的那個人吧!站起來大聲說。
 
學生:當你無法判斷你的對手會選左還是右時,選下是較安全的答案,因此你不必擔心收益變成0。
 
教授:沒錯,某些情況下選下是比較安全的,因為他避免了0收益。我的意思是,它的確避免了0收益,但選它也得不到5和4這連個最大收益。我不清楚你的回答想要說明什麼,我可能不太確定我的對手會選擇左還是右。舉個例子吧!我可能認為他選擇左和右的可能性是相同的,對嗎?那我們來分析一下。我們來看一下,我從上中下這三個策略中,分別能獲得什麼樣的收益?如果我認為我對手選擇左或右的可能性相同,所以接下來我們看看,在我認為對手選擇左右的可能性相同下的預期收益,我們把它稱為(½,½)。
 
那麼在我對手選擇左或右可能性相同的情況下,我的預期收益會是什麼樣的呢?是½乘5加上½乘0,等於2.5,沒算錯吧?那我在(½,½)情況下,選中的預期收益是什麼呢?在此情況下,我依然認為對手選左選右的可能性相同,在這種情況下,我預期收益是½乘1加½乘4,總和還是2.5,大家都看懂了嗎?目前算得都對吧?那在(½,½)情況下,我選下的預期收益呢?它等於½乘4加½乘2,即6的½,也就是3。
 
這個結果和剛才那位先生說的,如果我覺得我對手選擇左或右的可能性相同的話,這時候最好的選擇。也就是說我的最佳對策是選下。不僅僅因為它是個折中的方案,不僅僅選它很安全,實際上它是我的最佳對策,它最大化了我的預期收益,現在我們還沒到那一步。我們知道上是左的最佳對策,中是右的最佳對策,我們還知道,如果我們認為對手選左或者是右的可能性相同的情況下,下是此情況下最好的策略,但是這不是我唯一的信念。
 
比方說,我可能認為對手選左的可能性是選右的可能性的2倍,這也可能啊!選左可能性是右的2倍,這個½與½的可能性是類似的。那麼在選左是選右的可能性的二倍時,選擇每個策略的機率是多少呢?機率分別是多少?(2/3, 1/3),如果你覺得對手選左的可能性是2/3,而選右的可能性是1/3,即對手選左的可能性是右的2倍時,我們再重新計算一下。並且理論上,對於每一個可能的機率,我們都可以進行預期收益計算,不過這樣做會很枯燥,與其一個一個地算,不如我們畫張圖吧!
 
我要在這裡畫一張圖,座標系的橫軸表示對手選右的機率,也就是我關於對手選右機率的信念,把它想像成信念吧!座標系的縱軸,由於種種原因,我畫了兩個縱軸,縱軸表示我的預期收益,我們從在圖上表示預期收益開始。稍微等我一下,我先標注出來幾個點。我標注了1、2、3、4、5,你們也跟我在筆記本上一起畫吧!你們的內頁應該有準線,應該更好畫。
 
我先把選上的預期收益標注出來,這不是很難。我們知道如果我選上的話,我對手選右的機率就是0。也就是說我選上我對手會選擇-我說錯了,重新來。如果對手選右的機率是0,也就是說我認為對手絕對會選左。同樣的,如果對手選左的機率是0,那也就是說,重新來,如果對手選右的機率是0,其實就是說他們會選左。因此,此情況下我選上的收益,從上面的矩陣看,我的收益是5,這是我選上,對手選左時我的收益。
 
相反,如果對手選擇右的機率為1,並且我選的是上,那我的收益為零。也就是說,這個點表示,我選上對手選右時我的收益。我們已經計算過了機率是½的情況,即在對手機率是(½,½)的情況下,我選擇上我從中獲得的預期收益是2.5,這樣圖上就有三個點了。除了這三點,剩下的圖像是什麼樣的?這三點以外的圖像是什麼樣的呢?是一條直線,你要是不信回去自己驗證一下。事實上我畫成直線是絕對正確的。
 
這條線表示什麼呢?它表示在對手選擇右的不同機率下,我選擇上的預期收益。並且這也實際上等於,如果用方程表示的話,它等於1減去對手選右的機率,乘以此時我的收益是5,再加上他們選右的機率,乘以此時我的收益是0。這個並不是極其重要,但這是該直線的方程式。那我選中情況是怎樣的呢?
 
我們再來畫一條線,我們先來描點吧!如果對手選右的機率是0,也就是說對手選左,此時我選中的收益是什麼?我的收益是1。我還是用這根棍子來指吧!對應的是這個點。如果說對手肯定選右,即他們選右的機率是1,此時我選中的收益是4,就是這個點。而且我們已經計算過了,如果我覺得對手選左選右的機率相同,即他們選右的機率為1/2時,我選擇中收益為2.5。
 
把這些點連在一起,我知道它一定會經過這一點,這次我們又畫出了一條直線。我感覺我畫的不是很直啊!大概大概吧!這條線表示什麼呢?這條線表示,參與人I在對手選右時,選擇左而獲得的收益。這條表示對手選右時,參與人選中的收益。兩個端點中間的線段部分,表示參與人I選右的預期收益。它是對手選右機率的一個方程式。這次我們同樣能寫出它的方程式,方程式是,1減對手選右的機率再乘以1,加上對手選右的機率乘以4。對這個方程式也不需要太深究,在這裡我們不強調數學運算的,我把它寫出來是為了表述完整。大家都跟上我思路了沒?
 
現在我們再畫出第三條線。我應該換種顏色畫第二條的,那我換個顏色吧!我們來畫出對應選下的直線。對於線上的點我就不再贅述了。第三條線會經過這個點,會經過(0,4)和(2,0)。這條線表示對手選左時我選下的收益,這條表示對手選右時我選下的收益,這些都是從之前的矩陣總結來的。這兩點之間依然還是一條直線,這就是第三條直線了。它表示參與人I選擇下獲得的收益,是另一個參與人選右機率的一個函數。對於這一條直線,我們依然能夠給出方程式,即4(1-Pr)+Pr*2。
 
我覺得從圖像上面,我們就能得到所有想知道的資訊了。當我的老闆過來的時候,當校長列文或者巴裡·納萊巴夫來找我,他們二位就坐在教室後面呢!當他們問我為什麼這麼選時,問我有沒有理由的時候,我就能這麼說了。比如說,我把交點標注出來,比如說我可以這麼說,如果我認為,我們把稱這個點為X,如果我覺得我對手選右的機率小於X,那麼我的最高的收益對應的是這條線,也就是最高的那條線,即表示我選上的收益那條線。也就是說,如果我覺得對手選右的機率小於X,那我的最佳對策是選上。
 
相反,如果我覺得對手選右的機率會在交點Y的右方,即比Y大,也就說對手選右的機率大於Y,那麼這三條線中最高的是這條線,這條線表示我選中的收益。所以在這個區間內,我最佳對策是中。我們把它寫在黑板上吧!在這個區間內,我的最佳對策是選中。但是在這個區間內,我的最佳對策是上。而這中間的這個區間內最高的線,表示我對於對手選右機率的信念。我認為機率大於X但小於Y,此時我的最佳對策對應的是藍色的線,此情況下我的最佳對策是選下。
 
對三種情況我都給出了合理解釋,並且我希望巴裡不會解雇我。如果我們再深究還能獲得更多資訊,不過今天就算了吧!實際上我們能夠解出X和Y的值,我們怎麼解呢?我的意思是,我現在不會去計算,因為我可能會算錯。但是如果你真的很想解出X和Y的值,因為這是一節需要快速反應的課,那我們花些時間來探討一下吧!怎樣解出X和Y的值?誰不是數學專業的?告訴我們怎麼解呀?數學專業的覺得它太簡單而不屑去解。哪個數學專業的同學來告訴大家如何解出X和Y的值?請把話筒遞給她。
 
學生:令交點處的兩個方程式相等,然後就可以解出來了。
 
教授:很好,解釋得很清楚。要解出X,X是這條藍線與紅線的交點,接下來我們只需要列出這兩條線各自的方程式,也就是這個方程式和這個方程式,把方程式中的P換成X,我就得到了兩個等式和一個未知數。錯了,是一個等式和一個未知數。我讓兩個方程式相等,只剩下了一個等式和一個未知數,因此我能解出X的值,我記得我在家也是這麼算的。如果你回去自己計算一下,你會發現X等於1/3。
 
我再重複一遍,我知道你們之中有些人數學不怎麼好,我放慢一點說,我是這麼解的。看這條粉線的方程式,還有這條藍線的方程式,X是二者的交點,也就是說這點兩個方程式相等,在這兩個方程式中間加個等號,將這裡的Pr換成X,就會得到一個等式和一個未知數,剩下的問題,大家高中的時候就該會做了吧?都會了嗎?
 
接下來我們我放慢一點。在下一講我還要用這個方法,我要向大家介紹最重要的課程,抱歉,是整個課程中最重要的賽局,事實上,它也是世界上最重要的運動。世界上最重要的運動是什麼?先不要走。世界上最重要的運動是什麼?我們會用最佳對策來分析。我們會仔細分析,從這個世界上最重要的運動中學到很多知識。世界上最重要的運動是什麼?足球,英式足球。英式足球是世界上最重要的運動。我們講學到賽局理論講如何幫助我們在足球比賽罰球,巴裡·納萊巴夫就坐在教室後面,他手裡有需要教材,是一本不錯的教材,你們走之前去他那裡買一本吧!

 

講座4-在足球運動及商業夥伴關係中的最佳對策
 
第四講概述:
我們繼續上堂課的概念,即我們認為別人會怎麼做時所採取的最佳對策是什麼。我們特別發展出一個概念就是,不要選擇在任何信念下都非最佳對策的策略。我們用這種概念來分析足球運動中的罰球。然後,我們用它來分析一個利潤分享的夥伴關係。課程最後,我們介紹一個新概念:納許均衡。
 
閱讀作業:
杜塔著《策略與賽局:理論與實務》第五章
喬爾•沃森著《策略:賽局理論簡介》第六至九章
迪克特及奈爾巴夫著《策略性思考》第三章,4-6節
 
資源:
 
講座4-在足球運動及商業夥伴關係中的最佳對策
2007年9月17日
 
Ben Polak 教授:上一講我們引入了一個新概念,這個新概念就是最佳對策。這是什麼意思呢?在你已經對別人如何行動有一定信念時,你能想到的最佳的策略。你的對手會怎麼做,其他人又會怎麼做,你可以把它看成,你可以把這個信念理解成讓你的策略合理化的理由。所以如果你為別人打工,你的老闆問你為什麼做出這樣的選擇,如果你針對自己的信念做出了最佳對策,你就可以說,我之所以這麼做,是因為我認為其他人會那麼做,因為那的確是在這種信念下的最佳策略,你也就不會因此被炒魷魚了。
 
我說過今天我們將討論全世界最重要的一個賽事,正如我上次所說的,它就是罰球。所以這是一個有關足球的賽局。我先告訴在座不是球迷的同學,為什麼說這個很重要,因為上屆世界盃冠軍就是罰球決定的。拿英格蘭做例子吧!英格蘭每次在世界盃或者歐洲盃中出局,都因為栽到了罰球上,尤其是對陣德國的時候。再舉個最近的例子吧!比如這週末,在場的各位都覺得世界上最重要的事,是國會對伊拉克採取何種行動。但我覺得最重要的事發生在英格蘭。我最喜愛的足球隊,朴茨茅斯隊,對抗助教長卡茄最喜愛的利物浦隊。大約在比賽進行了三分之一的時候,裁判判罰了一個罰球,過會我會告訴你們最後怎麼樣了。請大家注意一下,上周發生的事與這一講有關的,是朴茨茅斯隊對利物浦隊的比賽。主助教卡茄是斯堪的納維亞人,我也很好奇為什麼他要支持利物浦隊,不過我猜他大概這麼拼寫利物浦。
 
接下來,我們來用數字表示。在不同角度踢罰球射門,能夠得分的機率。為了確保每個人都能理解,需要我描述一下大致情況嗎?大家都懂足球吧?有一名隊員會準備起跑,並主罰這個罰球,對方門將站在球門線上,罰球者的目標是射進這個球,知道這些也就夠了。你們都看過足球比賽,對吧?要是你沒看過,你應該去看看。你這輩子該幹的兩件事是,讀莎士比亞的書還有去看場足球比賽。
 
大概的資料如下,一會我會提供更精確的資料,我一會兒會給大家更精確地資料,目前為止這些資料就夠用。罰球隊員可以選擇三種不同射門路徑。他可以選擇左路、中路、右路,我不應該只說他,應該說他或她,如果我以後又沒注意,請大家多多包涵。門將可以選擇撲向左路或者右路,原則上說,門將也可以守在中路不動,我們等會再討論這一點。這邊代表罰球隊員,稱他為射手吧!
 
這邊代表門將,差不多就是這樣。我先把收益寫一下吧!一會再來解釋。你們會注意到,我會先寫一個正數,然後再寫出它的相反數,收益大概如下:(4,-4),分別為(4,-4)、(9, -9)、(6, -6)、(6, -6)、(9,-9)和(4, -4),4在這裡表示進球機率是40%,前提是你從左路射門,而門將也撲向左路。收益u1(l,L)表示門將撲向左路時,罰球者從左路進攻的收益是4,也就是說球被射入球門的機率是40%。
 
對罰球者來說,他的收益是進球的機率,而門將的收益是其相反數。我們把問題簡化一下。正如之前所說的,現在我們先不考慮門將可能選擇留在中路的情況,我們應該如何來分析這個重要的賽局呢?我們可以運用到幾周以前,還是一周以前學到的知識,使用優勢策略的觀點來分析。有哪個參與人有劣勢策略嗎?兩者中的任何一人有劣勢策略嗎?很顯然都沒有。
 
我們先來看看罰球球員,你可能認為中路比左路好,那請你仔細看一下。在門將撲向左路時,從中路射門的收益確實比左路高,如果門將撲向右邊,中路反而不如左路了。因此毫無爭議地說,如果門將撲向左路,你最好選擇從右路射門,其次是從中路射門,最差的選擇是從左路射門,這是門將撲向左路時的情況。如果門將撲向右邊,你最好從左路射門,其次從中路射門,從右路射門是最差的選擇。這些都是常識了吧?
 
好了,如果我們只學了第一周的內容,即如果我們只學到了剔除劣勢策略的話,我們沒招了,我們無法解釋這個賽局。但我之前說了,這是個很重要的賽局,這對賽局理論來說可不是個好消息。幸好我們還可以做更深入的研究。但是開始之前,我想在班上做個調查。有多少人會,假設你為一個球隊效力,比如說是美國國家隊吧!可能有些難以啟齒,沒關係。如果你們為美國隊效力,現在由你們來主罰罰球,而且那是世界盃上一個制勝球,請你們舉手,有多少人選擇從左路射門?有多少人選擇中路?又有多少人選擇右路?
 
看來大家的意見分佈得比較平均。我們假設這些資料都是準確無誤的,我們來分析一下意見如此分佈的原因。我們從何下手呢?我建議用上次的方法,作圖來表示我對門將的策略。存在某種信念下我的預期收益,這和上一講的圖像是一個類型的。
 
橫軸表示的是我的信念,我的信念表示我認為門將撲向右路的機率。和我上次做的一樣,畫兩個縱軸來幫助我們作圖。這裡是0,這裡是1,你們筆記本裡有行,但是黑板上沒有,我只能自己畫了。這裡分別是2、4、6、8、10,標注上2、4、6、8、10,這裡也是2、4、6、8、10,一樣標上2、4、6、8、10,這張圖的框架就畫好了。
 
我們從左路射門這種情況開始分析,我們用紅線表示,我從左路射門而門將也撲向左路時,我的收益是4。如果我從左路射門,而門將不會去撲向右路,也就是說他會撲向左路,此時我的收益是4,也就是說我進球的機率是40%。如果我從左路射門而門將撲向右路,那我有90%的機率進球,即我的收益就是9。順便問一下,為什麼是90%而不是100%?因為我可能會踢飛,這種情況也會經常發生,機率是10%。
 
我們已知兩者之間是線性關係的,所以我們用直線連接兩點,這條線表示什麼?它表示參與人1從左路射門的預期收益,與門將撲向右路的機率有關。同樣的,我們按順序來吧!
 
如果我選擇從中路射門而門將撲向左路,這種情況下,我的收益是6。如果我從中路射門而門將撲向右路,此時的機率仍然是60%,同樣這也是線性的關係。這條線表示從中路射門時罰球者的收益,是門將撲向右路機率的一個函數。
 
最後,用綠線來表示吧!我們來看看我從右路射門的預期收益。如果我從右路射門而門將撲向左路,我進球的機率是90%,即收益是9。相反,如果我從右路射門而門將撲向右路,我進球的機率是40%,收益是4。這條綠線表示作為一個罰球球員,我從右路射門的收益,是門將撲向右路機率的一個函數。
 
大家都知道我怎麼畫的這個圖了嗎?這比上一講的圖要簡單。從中我們能得出什麼結論?我們首先能得出什麼樣的結論呢?假設這些數字都是真實準確的,你能從這張圖中看出什麼?能把麥克風遞到這裡嗎?艾爾,給穿紅上衣的小夥子,讓他回答。你叫什麼名字?大聲說出來。
 
學生:在6那條線,即從中路射門的線上,任何一點都無法使你獲得較高的收益。
 
教授:很好,完全正確,我希望大家都能從圖中看出來。得出這一點的橫座標是½不難,如果門將撲向右路的機率小於½的時候,此時你的最佳策略用這段綠線表示,即你應該從右路射門。如果門將從右路射門的機率小於½的話,抱歉,是門將撲向右路的機率小於½,你應該從右路射門。
 
相反,如果你認為門將撲向右側的機率大於½的情況下,此時你最佳策略用粉線表示,即從左路射門。也就是說,如果你覺得門將撲向右路的機率大於½的話,你最好選擇從左路射門。在給出的這些資料下,無論你認為門將有多大機率會撲向右路,從中路射門絕對不是一個合理的選擇。我說的沒錯吧!或者換個說法,從中路射門,無論在何種信念下,都不是一個最佳對策。
 
這就是我們得到的結論,尤其是在我們之前講的例子裡。假如你在世界盃的賽場上,你為英格蘭效力,你不單要向隊友和經理人解釋,還要向六千萬的憤怒的球迷解釋你為什麼會這麼做。我們從中得到了什麼結論?我希望大家都清楚結論是什麼。結論是,無論如何千萬不要從中路射門。我來簡單證明一下,德國人就不用聽了,你們愛幹什麼就幹什麼吧!
 
這週末,在我支持的朴茨茅斯對戰卡茄支持的利物浦的比賽進行1/3時,裁判判罰了一個罰球,朴茨茅斯獲得一個罰球,主罰罰球的球員站在球門前,一腳把球射向中路,門將撲救成功。這個罰球不僅毀了我的大好週末,還讓我錯失了調侃卡茄的機會,真是虧大了。這週末的罰球未射進,絕對是因為罰球球員不懂這個規律。
 
從中可以總結出一個更普遍的規律,這個普遍規律就是,不要選擇一個在任何情況下都不是最佳對策的策略,或者說這個規律就是,不要選擇這樣的策略,不要選擇任何信念下都非最佳對策的策略。我再提一下,上一講最後的結論,強調一下,我並不是說信念是這種形式的,即門將會撲向左路或者門將會撲向右路,它包含了所有可能下的機率。所以,打個比方,這裡也可以包括門將撲向左右兩路機率相同的情況。
 
但任何信念下這麼選都不合理。我們從這個賽局中可以得出,我們能夠剔除其中的一個策略,在本案例中是從中路射門,儘管這裡並沒有劣勢策略。因此,當我們尋找並剔除劣勢策略時,我們是無從下手的。但現在,至少我們有點辦法了,我們至少剔除了從中路射門的策略。現在如果你能讓英格蘭或者朴茨茅斯球員學會這個規律的話,我會非常高興的。
 
在我們結束討論之前,我來強調一下,我們應該回到現實中。這是一個很簡單的足球模型,我來看一下,有人是耶魯足球隊的嗎?沒有啊!有人為自己學院踢球的嗎?有一兩個。有多少人踢過足球啊?多少人踢過足球?好吧,剛才我還有點擔心。在上一講,當我們從一個模型中總結結論的時候,我們應該回過頭重新審視一下,看看我們是不是疏漏了什麼。所以我們也回頭看看,我走下講臺以方便裘德拍攝,我們忽略了什麼嗎?在這個足球的模型中我們忽略了什麼?這是一個賽局的模型,對吧?我們忽略了什麼?為什麼這不是一個絕對準確的模型?準備好麥克風,你來回答吧!你離麥克風很遠,大點聲說。
 
學生:你最好從左路還是右路射門,和你是左撇子還是右撇子有關。
 
教授:很好,我們忽略了這一點,我們忽視了實際上慣用右腳的球員從左路射門會更容易些。罰球球員的左路就是門將的右路,習慣用右腳射門的球員從左路進攻,會更容易把球射入球門,大家都同意這一點吧?有沒有人有過類似的經驗?從另一側擊球更容易發力,在棒球中這個道理也是適用的。從另一側擊球的話,更容易打出大力球。你還有什麼想法?
 
學生:罰球球員事先沒有做好決定,而是見機行事。
 
教授:沒錯,球員在罰罰球之前沒有主意,我覺得這也說得通,對嗎?我們可以認為罰球隊員在球被踢出的瞬間才做出決定,你完全可以在回到更衣室時才做出決定,也可以在中場休息的時候做決定,但最重要的是,希望這討厭的聲音不會再出現了,我覺得這不是從我麥克風裡發出的吧?以防萬一我還是把麥克風調低點吧!因為麥克風調低了,我得大點聲說了。什麼時候做決定不是很重要,直到比賽結束之前,門將都不會知道你會從哪路罰罰球,罰球隊員也不知道門將會撲向哪路,這就好像所有決定都在罰球球員起跑的一瞬間完成的。還有別的想法嗎?請他來說,泰爾,把麥克遞給他吧!請起立,大點聲說。
 
學生:門將可能會在中路等待
 
教授:門將也可能守在中路,當然了,那也是個不錯的選擇,我把這一點從模型中給抽離了。實際上我們一會會回來討論,我準備把這一點作為習題集留給大家。你說的很對,這也是一個關鍵問題。還有嗎?現在我們用真實的資料來和我們的結論比對一下。我列舉的數字都是我很久前編出來的,在我需要在課上引用數字的時候就有了,有人還為此做了調查。
 
實際上剔除了從中路射門,剔除中路會……這些是真實資料,這些資料來自基亞波裡及其同伴一起,發表於《美國經濟評論》的一篇論文,耶魯大學的同學要是想看這篇論文,可以去JSTORE或者圖書館去查閱,如果你感興趣不妨去查閱一下。他們編制了下面這個表格,這會我們稍微嚴謹一點。現在我用反轉的方式表示左右,因為實際上,他們為此做了有關人自然方向與非自然方向的研究。就是說如果你習慣用右腳射門,那麼你從左路攻門就是自然方向,在這裡左路表示自然方向。當然了,如果你是左撇子那剛好相反。
 
但是我要提前強調一下,研究的結果,機率分佈如下:63.6、94.4、89.3和43.7,所以事情不像是……我雖然沒有給出中路的機率,但是我們先不管這些數字到底是誰總結的,我們發現我們走運了。當你從自然方向攻門的時候,你進球的機率會稍微提高,這雖然不能成為劣勢策略,但我們還是能得出一樣的分析結果。實際上這和我編的數字相差也不是很遠,凡事並不總是絕對對稱的嘛!我忘了這是誰說的,但它絕對是真理。
 
門將守在中路的確是個問題,我們會在習題集中研究它。但除此之外還有一個問題,我再來提出一個問題吧!另一個問題是,在你主罰罰球的時候,除了左路右路外還有別的需要考慮嗎?有人要主罰罰球了,他還要考慮什麼別的因素嗎?請那位女士回答,你還要考慮什麼?
 
學生:你可以踢到頂角去
 
教授:你可以選擇罰球的高度,這一點很對,很有道理,但是我指的不是這個。你說的沒錯,但是我想要別的答案,還有別的答案嗎?請這個小夥子來答。
 
學生:踢弧線球
 
教授:這個太高端了,來點正常的。很容易想到的是什麼?更容易讓大家想到的是什麼?把麥克風遞給你前面的同學。
 
學生:球速
 
教授:球速是正解。你還需要考慮,當你主罰罰球時,你是大力抽射還是小力輕擦,踢球的力度與射門的方向,這兩者是同樣重要的。比如你是這樣的一種人,我也不得不承認,我以前也是這種人。如果你是那種能夠大力抽射,但是精準度不高的人,那這些資料對你就不太准了。如果你只會大力抽射,但是缺乏精準,當你射向左路或者右路時,你有可能會射偏。另一方面,如果你射向中路,因為你踢球的力道較大,你反而更容易進球。
 
如果你覺得這些聽起來稀奇古怪,且它們與你毫不相干,那我們就來看看這個圖像吧!以後我們不討論足球了,至少今天是不會討論了。如果你是那種力道很大,但是精準度不高的人,你從右路射門進球的機率可能不會很高,因為你可能會射偏。從左路射門進球的機率也不會很高,你同樣可能會射偏。然而如果你從中路射門,你進球的機率可能會提高,因為你一腳抽射,門將很難撲到它,這是中路射門的情況。如果你仔細看,我可能畫的不是很清楚,你會發現曾經賣傻似的中路射門法,現在竟然一下子變成佔優勢了。
 
請大家看這條虛線,在這兩點中間的範圍內,就是這個小區間內,從中路射門也是個不錯的選擇。所以分析實際情況時要深思熟慮,比如說,我們需要把罰球隊員的射門力度跟精準度考慮在內,如果你們對足球感興趣的話,我發現,大多數美國的同學對此毫無興趣,但是那些美國以外的同學,如果你們對現實中的足球比賽很感興趣,就像我之前說的,我會把文章的詳細內容發佈到網站上。
 
我強調一點,我給你們的資料是真實資料,但它是綜合了各種能力後的資料。這些資料一半來自強隊義大利隊,一半來自弱隊法國隊,天知道它到底有多少是可信的。好了,這就是我們今天的案例,也是我們今日理論聯繫實際的內容,我擦下黑板,然後我們講別的了。我們講點正經事兒,這就是我們今天的案例了。我還是回頭很形式主義地概括一下吧!順便提一下,比賽的結果是0比0,對我來說還算個精神勝利吧!
 
我想正式地描述一下我之前隨口說的事,尤其是我想給出最佳對策的正式定義。我寫出最佳對策的兩種不同形式定義,一個是參與人針對對手策略的定義,比如這裡的左路右路。另一個強調的是,最佳對策的廣義上的定義,我們接下來要用枯燥的符號表示了。
 
參與人i的策略Ŝi,我把Ŝi帽讀出來是為了讓大家記住,是一個最佳對策,以後簡寫成BR了,是對手的策略S-i的最佳對策。以下我們使用符號表達更方便。如果參與人i在對手的策略S-i下,選Ŝi的收益弱優於其他策略Si',這對於參與人i的所有si'都適用。在以前的定義中,「對所有的」這個限定詞,修飾的是其他參與人的策略,在這裡修飾的是我的策略。
 
策略Ŝi是其他參與人策略S-i的最佳對策。如果此時我選Ŝi的收益弱優於此情況下選Si'的收益,這對於所有我可以選擇的策略都成立。還有一種書寫方式,可以這樣寫。Ŝi滿足下列情況,它最大化了對手選S-i時我的收益,希望你們都聽懂了,我希望大家都習慣地使用最大化一詞。解最大化問題時,如果其他人選了S-i,我如何最大化自己的收益呢?在座的有數學恐懼症的同學不必驚慌,這僅僅是用數學運算式,來表示我們今天學到的一些知識點罷了,其實是這一講和上一講的知識點。
 
我想讓這個定義更具有普遍性,因為我想讓它適用於更廣義的信念中。我來寫一下,參與人i的策略,和之前一樣,Ŝi是最佳對策,但請注意,它是在你對其他參與人可能採取的策略持信念P時的最佳策略。但是當我們加入了預期之後,這就變得和以前不大一樣了。在參與人i仍持信念P的情況下,她選Ŝi的獲得預期收益,比在同樣的信念P下選其他的策略,獲得的預期收益都要高。最好再加上對於所有可選的Si'均成立,這和以前的概念差不多。唯一的不同就是,我這裡稍微用了一些數學符號,來表述策略帶來的收益與所持信念有關。這裡的收益指的是預期收益,即所持信念下的預期收益。
 
我們也可以換一種方式表達。我從Si選擇可選策略時,Ŝi而非S-i,最大化了我的預期收益。預期收益是什麼意思呢?我來給大家解釋一下什麼是預期收益。比如此案例中,在參與人i持有信念p的情況下,他選擇左路攻門的預期收益等於門將撲向左路的機率,乘以兩人都選擇左路下參與人i的收益,再加上門將撲向右路的機率,乘以門將撲向右路,參與人i左路進攻時參與人i的收益。好了,其實在信念P下的預期和大家理解的預期意思是一樣的,這裡只是稍微用了點數學符號,還有簡單的公式,大家都聽懂了嗎?我就不全都寫下來了。我寫在黑板上的都是那些乏味的定義,我想你們忍受很久了。
 
學生:(聽不清楚)
 
教授:多謝指正,這些看起來就是一些毫無意義的運算式嘛!為了更好地學習這些概念,而不是這些運算式呢!接下來的半小時,我們來聯繫實際情形。雖然接下來的案例不如足球那麼重要,不過它們都是經濟學案例,所以我們可以用經濟學的知識來解讀。我把足球的案例擦掉吧!想一下,如果賽局中加入了合夥人會怎樣?暫且就成為合夥人賽局吧!我記得在沃森寫的教材裡介紹過,或者就是類似的內容,如果你沒聽懂可以回去看課本。
 
大概是這樣的。有兩個實體共同完成一個協作專案,比如說可能是個律師事務所,這兩家公司平分利潤,也就是說這兩家公司互相賺錢。我說錯了,是交叉控股。另外一個例子是,兩名同學為了做作業組成了一個學習小組,總結起來就是兩家公司平分利潤,但是都要各自為協作專案付出努力。我們用正式點的語言來表達吧!
 
這兩個參與人都是公司的股東,他們都持有公司的股份,他們共同擁有這家公司並且平分利潤,即他們各自持有50%的股份,所以這是種共盈的夥伴關係,每個股東都要選擇為公司投入多少精力。比方說你是個律師,你就要計畫好為公司工作多長時間,對於大多數人來說,就是要決定你每天在公司工作20小時,還是每天工作21小時這樣的問題。你們一起做作業的時候,我希望作業不會消耗你們那麼多時間,比20小時少點就行了吧!
 
我們用小時數來表示策略吧!用0到4的數字來標記這些策略。你可以從0到4中任選工作的小時數,在繼續前,因為首次遇到它,我強調下。目前為止我們遇到的賽局,每個策略都是不連續的。比如那個數字遊戲,你能從1到100這100個數字中選擇。這裡的策略是連續的,你可以選擇0到4間的任意實數,也就是說你的策略是連續的。這點不是至關重要,但要強調一下。再強調下,是連續的策略空間。原則上,你可以按分鐘或者按秒鐘從你的客戶那裡收取費用,假設這個企業的利潤是已知的。
 
這家合資公司,也就是律師事務所,利潤是按照下面的運算式計算的:4乘以參與人I的付出加參與人II的付出,再加參數B乘以二者付出的成績,這就是利潤運算式。先不討論B。我是說我們先不討論B到底多大,我們照常計算。假設B是0到1/4之間的已知量,我希望一會能改變一下這個資料。這個運算式說明了什麼?說明了參與人I努力工作對公司有利,同理可知,參與人II也一樣。但是二者的合作同樣起到了作用,我們怎麼考慮合作這個問題呢?你們怎麼看B*SI*S2這個運算式?
 
比如你們兩個人交一份作業,你們交上來的只是S1+S2,那你會怎麼想?你會覺得沒有必要組成學習小組了。如果總收益只是投入的和或者倍數,那這樣合作也沒什麼意思了。但是現實是在你和他人合作中,你會獲得額外的收益,這樣合作才有價值,我說得沒錯吧?因此我們可以把合作理解為互補或協同,雖然協同這個詞現在不是很常用了。所以我們假設合作中就要有協同。有人擅長作業裡的一部分內容,別人擅長另外一部分內容。律師事務所也是一樣的。有人是知識產權達人,別人可能處理欺詐案件很有經驗。
 
現在我們有股東、有策略,還知道了企業利潤的計算方法,我還需要告訴你們收益。
 
說一下收益吧!很顯然,參與人I的收益取決於她和合夥人的策略,因為他們兩人平分利潤,所以是½*4(S1+S2+B*S1*S2)。她得到了一半利潤,但她成本是S1平方。也就是說她的投入是S1的平方,這是她的努力成本。由對稱可得,參與人II的收益是一樣的,運算式也是一樣的,只不過我們要減掉S2的平方。
 
你的收益是公司的利潤,減去放棄了休息的負效用。第五排有一個同學可能很缺乏睡眠吧!旁邊的人把他叫醒吧!別拍他了,叫醒他就行。好了,你醒了吧!下次我就用錄影機拍下來了啊!現在我們已經獲得了所有分析此公司,還有分析這個案例原理所需的資訊了。不管你們是一起合作寫作業,還是開律師事務所。為了幫助大家理解,我的意思是,這確實有點程式化了,但是現今大多數企業都是合資企業,他們都類似分配利潤並且協作,因此對於商業來說這是個重要概念,毫無疑問。
 
接下來,我們要用最佳對策的概念來分析了,這對於你們來說應該不陌生了吧!下面我想知道,怎樣計算參與人I在參與人II每個策略下的最佳對策呢?每個s2下參與人I的最佳對策是什麼?我應該如何著手呢?我們之前畫了有關機率的圖像,圖像是在參與人的某個信念下的,但問題是之前參與人II只有兩個策略,所以我們能畫出那個簡單的圖像。
 
門將可以選擇撲向左側或者右側。現在問題是,參與人II的策略是連續的。想要把無限可能性的機率,做成圖都畫在黑板上是不可能的了,我們需要用別的方法。我們怎麼才能找出參與人I的最佳對策?有人回答嗎?請舉手,在角落那裡,給他麥克風,請起立,麥克風到你那裡。我們怎麼做呢?請大聲說,如何找出參與人I的最佳對策?
 
學生:參與人I的收益是參與人II付出的函數
 
教授:很好,這是我們要做的第一步,實際上我們已經得到了那個方程式,這個就是參與人I的收益的方程式。它是參與人I和II策略的函數,我們已經得到了,參與人I的收益是兩人付出的函數。那麼對於某個給定的S2,怎麼計算參與人I的最佳對策呢?
 
學生:求出S1的導數
 
教授:好的,求導。然後呢?
 
學生:令它等於0
 
教授:很好,下面我們要用到微積分的知識,我們只用單變數微積分的知識就夠了。我們只把S1看為變數,多少人-錄影機先別拍他們了,多少人沒有學過微積分?請大家舉手吧!如果你們沒有見過我將要在板書上寫的運算式,或者說高中畢業你們就忘了,沒關係。
 
課本的後面有一章,我記得是25章,會涵蓋這些內容,你們可以去重溫一下微積分。如果你以前沒有接觸過,或者說你們沒學過類似數學112的課程,來找我求助吧!我可能會開一個微積分速成班,專為沒學過微積分的人準備。如果我接下來的計算對你來說是天書,過來找我!我來幫你想辦法。
 
接下來我們要求導了。下面我們要問問我們自己,選S1下利潤的最大值是多少呢?我先算½乘以4吧!這樣省事兒。利潤是2(S1+S2+B*S1*S2)-S1平方,我們來討論在S2已知的情況下,S1的最大值是多少。就像坐在後排的先生說的那樣,我們要去求導,然後令導數等於0。我差點就寫錯了。你們仔細看著我寫的板書對不對啊!
 
想要求它的導數,先讓我想想一階條件。好了,我們來求導吧!2還保留,S1求導後是1,這裡的S1會變成B*S2,大家都會吧?S1的平方變成了負2S1,這就是求導過程。我這麼求導大家都會,是吧?這是高中的方法對吧?你們的思維開始運轉了嗎?為了達到一階條件,我說在最佳對策下,在S1上寫個帽,在最佳對策下導數等於0。好的,泰爾,把麥克風給之前的傢伙。
 
學生:為什麼不是2呢?算了,當我沒說。
 
教授:你大聲說出來這點很好,我寫板書的時候容易犯錯誤,這樣我就對它求出導數了。這是一階導數,令它等於0,一會我們就要計算了,但我先確定一下是最大值還是最小值。我怎麼確定是最大值還是最小值呢?我需要求出二階導數,即需要尋找二階條件,我們再次對S1求導,暫時先不要考慮這裡的帽。S1在這裡面就都消掉了,最後只剩下-2了。-2是一個負數,這正是我想要的。
 
最大值處的二階導數是負數,到這裡我滿足了一階條件,我們得出S2的最佳對策是Ŝ1,Ŝ1是這個方程式的解,它滿足一階條件。我們這麼寫,如果我除以2然後整理,可以得出Ŝ1等於1+B*S2,這就是在S2下參與人I的最佳對策。如果我照此計算,同理可得參與人II的-我就不算了,因為都是對稱的。大家都聽明白了嗎?
 
我們能夠同理繼續分析參與人II的,但我們都知道答案是一樣的,同理可得Ŝ2等於1+B*S1,Ŝ2是參與人II的最佳對策,因為它與參與人I的策略S1有關。好了,我們已經找到了參與人I和參與人II互相的最佳對策了,這些是在參與人II有上面的可能策略,同時參與人I有下面的可能策略情況下。接下來我們來看看能不能研究得更深入。我們進一步繪製圖像吧!
 
下面我們繪製兩個函數圖像,看看圖像是什麼樣的。你們記完筆記了吧?我擦掉了啊!我來換根粉筆好了。好了,我們接下來來繪製圖像。S1是橫軸,S2是縱軸,參與人I有1一直到4的可選策略,這條是45°線,我好好畫一下,這樣會準確點。參與人I的可選策略從1一直到4,接著畫之前先來看看B是多少。
 
好的,我們要畫這個案例的圖像,我要在圖中畫出參與人I的最佳對策,一會還要畫出參與人II的最佳對策。在這裡B等於1/4,我們之前也說過,B在0到1/4之間,這裡我們繪製B=1/4的情況吧!首先我們想要繪製的運算式是,參與人I的最佳對策是S2的函數,我們都知道它等於1+S2/4。對於任意定義域內的S2,我用紅色來表示參與人I的最佳對策,參與人II選0時,I的最佳對策是什麼?誰來說一下?
 
學生:是1
 
教授:因為1+0/4=1,參與人II選0時I的最佳對策是1。要是參與人II選4了呢?此時參與人I的最佳對策是什麼呢?這回就是1+4/4,即1+1=2。所以此時參與人II的最佳對策是2。如果參與人I選4,參與人II要-說錯了,是參與人II選4而I選2,這兩點之間是一條直線。我畫的這條線表明,參與人I的最佳對策取決於參與人II的策略,大家看懂我畫的了嗎?我假設大家都認為它是直線了,但這確實是條直線。
 
這個圖的作用是,給定一個S2,找到粉線對應的座標,然後就能找出參與人I的最佳對策,同理也可以畫出參與人II的圖像。參與人II的最佳對策取決於參與人I的策略,不用任何數學的方法,我就知道圖像是什麼樣的了。有人能舉手回答它是什麼樣的嗎?在同一個圖像裡面怎麼表示?參與人II的最佳對策是I策略的函數,找個沒回答過問題的人吧!他們之前回答過了,換個人。能不能把麥克遞給中間的小夥子?你從那邊過去好像容易些。大聲說,讓大家都聽清楚。
 
學生:它關於45°線是對稱的。
 
教授:沒錯,如果我畫了參與人II的圖像,即參與人II的最佳策略是SI的函數,我們只需要調換一下參與人,因為它們是關於45°線對稱的。他經過1到2這兩點,如圖所示,這就是在任意參與人I的可選策略下,參與人II的最佳對策。為了讓大家都明白,這條藍色線表示給定一個S1,即參與人I的付出。通過查找藍色的線,可以得出參與人II的最佳對策。好了,現在我們學到東西了。
 
回憶一下今天學到的結論。結論二-結論一是不要從中路射門,第二個更普遍的結論是什麼?不要採用非最佳對策的策略。我承認我偷懶了,因為我忽略了信念,但請大家相信在這個賽局裡面是可以的。這些策略都不會成為最佳對策嗎?換句話說,參與人I的哪些策略永遠不會成為最佳對策。有人知道嗎?那我們來看一下吧!
 
參與人II選0時,參與人I最佳對策是1,這是最小值了。參與人I的小於1的策略,永遠都不會成為最佳對策。如果參與人II選4,協同導致參與人I的最佳對策變成2,參與人I的那些大於2的策略,也永遠不會成為最佳對策,對不對?也就是說,小於1及大於2的策略,都不是參與人I的最佳對策。同理,參與人I最低只能選0,此時參與人II應該會選1,小於1的策略不是參與人I的最佳對策,大於2的也不是參與人II的最佳對策。
 
所以我們乾脆點,在筆記本上,你們動作輕點,我直接在劃掉這些非最佳對策的策略。參與人I的這些策略被剔除了,參與人I的這些策略也被剔除了,你們可能不太喜歡筆記太亂吧?參與人II的這些策略被剔除了,參與人II的這些策略也被剔除了,劃掉的都剔除後,最後剩什麼了?如果你們仔細觀察,會發現還剩一個小方格,我剔除了所有策略,所有非參與人I最佳對策的策略,還有非參與人II最佳對策的策略,最後只剩下了這個小方格。
 
但是現在這個小方格看不太清楚,接下來我重新畫一下這個小方格,我們一起重新畫一下,從1到2,我把這個小方格畫大一點。這一點是(1,1),上面這點是(2,2),接下來我們把精度提高到1/4。這裡分別是5/4、6/4、7/4,我們在方格內填充粉色和藍色的線,這是那個小方格的放大圖。這些線如圖所示,粉色的線從這一點到這一點,藍色的線從這一點到這一點,大家回家後可以仔細畫一下。但並非意味著黑板上的不對。
 
我只是把之前的圖像給放大了。有人見過這個圖嗎?誰以前見過這個圖啊?除了座標變了,其他的和以前一樣。一旦剔除了非最佳對策的策略,仔細研究剩下的策略時,圖像還和以前看起來是一樣的。儘管座標改變了,圖像放大了,目前為止我們學到了什麼呢?我們學到了參與人不應該選擇非最佳對策的策略,應該剔除它們。最後剩下什麼呢?接下來怎麼辦?
 
這些沒有被剔除的策略,是某種情況下的最佳對策,但剩餘的最佳對策現在可能也要被剔除,是這樣吧?這和我們之前學過的迭代剔除劣勢策略類似。我要剔除的策略,並非都不是最佳對策,它們可能是某種情況下的最佳對策。我們都知道使他們成為最佳對策的策略,是不會有人採用的,因為這些策略本身又不是最佳對策。我能想到什麼樣的策略呢?我還要剔除掉哪些策略?
 
舉個例子吧!參與人I知道參與人II不會選小於1的策略,所以參與人II最低只會選策略1,也就是說參與人II在任何情況下,只會選1及以上的策略,這樣參與人I不會選小於5/4的策略。參與人II最大只會選策略2,參與人I針對這種情況下,最大只會選擇6/4,即大於6/4的策略也會被剔除。我們注意一下,我現在剔除掉的策略,他們並非不是最佳對策,他們是某些情況下的最佳對策,但是使他們成為最佳對策的條件是不會發生的,所以它們就不成立。
 
這樣我們又剔除了參與人小於5/4大於6/4的策略,參與人I只有1½的區間。同理可證,參與人II,如果我再進行一次,別在筆記上亂畫,我們只是想知道最後會怎樣,因為這些策略不會被人採用,所以我剔除掉它們。最後我得到了一個更小的方格。
 
大家看清楚了嗎?剛開始,我發現了參與人I的最佳對策取決於參與人II的可選策略,同時也發現,參與人II的最佳對策取決於參與人I的可選策略。我剔除了非最佳對策的策略,然後我看看還剩下哪些策略,這些策略是已被我們的剔除策略的最佳對策,但仍不是最佳對策,我就剔除它們。剔除之後,我得到了更小的方格,我可以一次一次的重複這個過程。
 
如果我不斷重複這個過程呢?最後結果會是怎麼樣的?大聲說,結果是什麼?會是一個交點對嗎?如果我不斷縮小這個方格,下一個方格會是這樣的,我就不去畫了,道理是一樣的。如果你不斷縮小方格,最後就會只剩交點了。如果我們知道人們不會採用最佳對策,說錯了,是不會採用非最佳對策,如果我們知道人們不會採用非最佳對策的策略,就知道人們不會採用非最佳對策的策略,以此類推了。這個賽局最後會歸為一點,每個人只有一個策略,就是交點處。
 
交點的橫座標是S1,暫且這麼叫吧!S1*=1+BS2*,而S2*=1+BS1。實際上我們能得出更多,因為我們知道這個賽局是對稱的。我們知道S1*=S2,我們利用S1=S2這個等式,這由S1和S2關於45°線對稱可以得出,這樣用S1*=S2*可以簡化了。最後,實際上是看似三個方程式,實則只有兩個方程式,因為其中一個暗示了另一個。我們都會解這個方程式,如果解完方程式,我們會得到-我得仔細點別算錯,我們會得到1-BS1*=1,或S1*=S2*=1/(1-B)。還有,每回我在黑板上演算,你們都幫我檢查一下,看看有沒有算錯,這次算對了嗎?我覺得對。
 
我代數總是算錯。最後解是S1*=S2*=1/(1-B),剛才的只不過是無聊的數學運算,我剛才就是為瞭解方程式。從中我們能學到什麼呢?我們學到了,在剔除非最佳對策的策略後,要再剔除那些在對手最佳對策下不是最佳對策的策略,以此類推,最後每個參與人都只有一個策略了。每個參與人只有一個策略,而那個策略是這個方程式的解。
 
如果我們是麥肯錫公司的管理顧問,或者給你們的作業提出點好的建議,或者對於現實中的律師事務所,我們都能夠預測出來,你可能會投入多少工作量。問題是,這個工作量是不是最優的工作量呢?你是在為麥肯錫工作,你被喬史密斯和安博客錄用,幫他們尋找合理策略,或者在學習小組裡一起做作業,你能算出來他們會投入多少工作量,但這個工作量合適嗎?是太多了還是太少了呢?
 
怎麼來回答?要依據什麼呢?讓我換個表達方式吧!這些企業合夥人,或者兩個共同協作做作業的同學,他們是否實現了最優效率了呢?我們做一個調查吧!誰覺得超越了?請把錄影機對準觀眾。我們來看看,誰覺得超越了?誰覺得剛好達到?誰覺得未達到?好多人棄權了啊!我認為他們沒有達到最優效率,我讓你們回去做一次作業,你們就都明白了。
 
事實上你會發現,如果有書面合同,或者有個規劃師的話,人們會超常發揮,我們來看看為什麼。為什麼這些律師事務所的律師、醫療合夥人或者其他類似的機構,還有一起做作業的學生,當我們研究過這些策略和賽局後,為何這樣的組合往往是收效甚微的?我來說個答案吧!我告訴大家,因為你們都想少幹活,人們因為什麼才會努力工作呢?有人知道嗎?把麥克風給他。
 
學生:因為我們知道如果自己超額完成工作,其他人就可以少做點工作了。
 
教授:沒錯,說得很有道理,但是你說的東西離題了。我的意思是,你給出的原因是一種囚徒困境,言外之意就是,我工作了其他人就偷懶,我覺得這裡有別的原因。更深層次的原因會是什麼呢?你說的我覺得是個好的開端,這裡面還有什麼別的原因嗎?
 
學生:如果有兩個人一起工作,每個人大約只需要做工作量的一半。
 
教授:說得沒錯,但這和偷懶沒什麼關係啊!這到底是怎麼回事?回顧一下經濟學115或者150,如果你們有人學過這些課的話,這裡潛在的問題到底是什麼呢?請那個穿粉紅色衣服的同學說一下。
 
學生:他們只能得到50%的邊際收益
 
教授:說對了,你叫什麼?
 
學生:派翠克。
 
教授:我認為派翠克說出了正確答案。這裡的問題不在於工作量多少,順便說一句,它和協同也沒什麼關係。你可能認為,這是因為他們沒有正確的考慮協同的作用,這不是問題所在。事實證明,即使沒有協同,此問題依舊存在。就像派翠克說的,問題出在邊際量上了。我是這家公司的員工,無論是律師事務所還是學習小組,我參與其中並承擔了邊際成本,我每多出一份力就多承擔等量邊際成本,但我只能獲得一半的好處。從邊際角度分析,我承擔了多付出的全部邊際成本,但我卻只能得到一半的邊際收益,因為利潤是均分的。
 
這會導致大家都減少付出,經濟學裡與之有關的通用術語叫什麼?叫外部性,這裡邊存在了外部性。外部性。當我計算要為公司付出多少時,我沒考慮到利潤的一半會歸你所有,這和協同沒有什麼關係,這也不是什麼複雜的理論,它就是你們在經濟學115裡學到的知識。如果你是一個公司的股東,或者和別人一起做作業及其他合作專案,你們需要注意到,因為外部性,實際上每個人都付出了較少的努力,我的付出不僅使我受益了。
 
雖然在板書上寫了,但再深入思考下,如果我們改變了協同的程度會怎樣?我們降低B的值會如何?B表示這些參與人之間的協同程度。如果我把B的值降低,圖像會怎麼變?我們重新畫一張清晰地圖像,圖像會是這樣子的。這是S1,這是S2。如果我們降低了協同度,在這種情況下,結果會是什麼樣的呢?圖像會變成什麼樣?誰知道?這是經濟學115的習題。我們要移動這些直線,你是不是叫亨利?把麥克風給他。
 
學生:直線會變得更平緩,最後會分別變成水平和垂直兩種情況。
 
教授:說得很好,但粉色的線會變陡峭,我理解你說的意思了。粉色的線最後會趨向垂直,藍色的線最後會趨向水平,請大家注意下,我們付出的努力會朝這個方向大幅減少。如果我們減少協同參數,不但我會少付出努力,而且你也知道我會少付出努力,因此你也會少付出努力,以此類推,最後會導致了剪刀效應。我們要從中吸取教訓,所以我們還是要繼續挖掘一下。
 
在這個賽局中我們通過尋找最佳對策,剔除非最佳對策來做出決策,重新審視,繼續剔除非最佳對策然後以此類推。還好這個賽局中出現了交點,粉色的線和藍色的線交於一點,這個點叫什麼呢?藍粉兩線的交點叫什麼?這是這一講的重要結論,這一點就是傳說中的納什均衡。
 
現在知道它叫什麼了。有多少人聽說過納什均衡?誰看過有關納什的影片?我們在下一講會繼續探討這個問題的,這就是納什均衡了,是個術語,而且這個知識點是相當重要的。因為你們大多數人之前都學過經濟學,而且都知道經濟學的交點都很重要,但這個交點說明了什麼呢?這和那條線有什麼關聯呢?粉色的線和藍色的線相交說明什麼?這一點有什麼特別的意義?這兩條線相交到底說明了什麼?請倒數第三排的紫衣人回答,請大點聲說。
 
學生:意味著每個參與人都不想偏離那一點
 
教授:正解。我們再從頭到尾看一遍。請問你叫什麼名字?
 
學生:艾倫
 
教授:艾倫認為,如果參與人I採取這個策略,而參與人II採取了相應的策略時,沒有人想要改變這種狀況。換句話說,沒有參與人想要採取別的策略了。所以當參與人I選擇S1*時,參與人II就會選擇最佳對策S2,如果參與人II選擇S2,參與人I就會選最佳對策S1,沒有人想要偏離這一點。簡單來說,參與人I和參與人II,在這兩條線的交點處,互相都採用的是最佳對策。參與人們都採用了自己的最佳對策,雙方都採用了各自的最佳對策,很顯然在這個賽局裡就是兩條線的交點。
 
我們回到之前玩的數字遊戲,每個人都必須選擇一個號碼,贏家是所選數最接近平均數2/3的人。順便說下,贏家的獎金未必是那麼多,但也可能就是那麼多。那個數字遊戲中的納什均衡是什麼?是每個人都選擇1。我們怎麼知道1是納什均衡呢?我們怎麼知道在那個數字遊戲中,選擇1就是這個賽局的均衡呢?我們來下定義。如果每人都選1,平均數就是1,平均數的2/3是2/3,1是最小值,所以每個人的最佳對策就是選擇1。
 
重複一下,如果每個人都選了1,那麼每個人的最佳對策也就是1,這就會成為納什均衡。誰在做這個遊戲時就想到納什均衡了嗎?我覺得絕對沒有人會。但是注意下,如果我們重複賽局會怎樣呢?當我們不斷地重複賽局,我們會發現最後會不斷接近1,沒錯吧?當我們反覆分析這個賽局,我們的分析最後會趨近均衡,雖然這不總會發生,但這也是納什均衡的一個亮點。有時結果會趨近這一點,納什均衡是現在直到期中的重點內容,週三我們會學習更多的有關案例。
 
 
講座5-納許均衡:劣勢潮流及銀行擠兌
 
 
第五講概述:
我們首先正式定義上一堂課的新概念:納許均衡。然後討論為什麼我們對納許均衡感興趣,以及我們怎樣才能找到各種遊戲中的納許均衡。我們以一個課堂上的投資賽局遊戲為例,說明社會環境中有很多均衡的情形,以及社會可能完全無法協調,或可能有較劣均衡的協調。我們認為,在現實世界中,協同謬誤是常見的情形。最後討論為什麼在這種不同於囚徒困境的協同謬誤中,簡單溝通可能是一個補救措施。
 
閱讀作業:
杜塔著《策略與賽局:理論與實務》第五章
喬爾•沃森著《策略:賽局理論簡介》第六至九章
迪克特及奈爾巴夫著《策略性思考》第三章,4-6節
 
資源:
 
講座5-納許均衡:劣勢潮流及銀行擠兌
2007年9月19日
 
Ben Polak 教授:上一講我們學到了一個新的概念,可能有些人覺得並不陌生,它就是納許均衡。
 
這一講我們來探討下納許均衡,並學習如何找出簡單案例中的納許均衡。在後半講中我們透過一個小遊戲來學習如何運用納許均衡,希望這個遊戲會很有趣。
 
首先我們給出納許均衡正式定義,上一講我們給出的是非正式定義,策略組合是一個集合,該集合包含每個參與人的一個已選策略,用S1*、S2* 一直到SM*表示,如果此賽局一共有M個參與人,納許均衡以後我就簡寫成NE了。納許均衡是滿足下列條件的策略組合,對於任意此集合內的參與人I,她所選擇的策略Si是其他參與人所選策略的最佳對策,當然,其他參與人的策略要用S*-i表示,也就是說,每個參與人都選擇了最佳的對策。
 
納許均衡目前是賽局理論最常用的解概念,比如去麥肯錫之類的公司面試時,你會發現公司要求面試者掌握納許均衡,為什麼我們要掌握納許均衡呢?不僅因為它是教材內容,它有很多實用價值,而且你去麥肯錫面試還會用到它。這可不是一個好的學習動機,而且我可不想讓大家覺得,我們花了這麼多時間學習納許均衡,學到的卻都是脫離實際的知識,絕對不是這樣的。
 
實際上,並非所有情況都能達成納許均衡,比如說在我們之前玩的數字遊戲中,每個人都選擇一個數字。我們之前講解過的,這個遊戲的均衡就是每個參與人都選1,但實際操作下來平均數遠高於1,在13左右。當我們重複進行這個遊戲時,平均數的確趨近於1了,但是我們第一次做這個遊戲時並未達成納許均衡,所以我們不能想當然的認為人們總能達成納許均衡,或理性人就能達成納許均衡,上述的說法都是不正確的。
 
誠然,除了納許均衡被廣泛運用之外,學習納許均衡還是有充分的理由的,我們不妨來稍作討論。我先在這裡寫一下學習動機,我們上一講討論過,第一個動機其實是你們當中的一員提出來的,其實就是不反悔,這怎麼講呢?假設我們分析一個納許均衡,如果把其他人的策略看成不變數,任意參與人I都不會改變策略。我再重複一遍,把其他參與人的行為看成不變的,任意一個參與人都不會改變策略。說得更嚴謹一點,任何參與人都嚴格不會改變策略,我們一會就知道這一點很重要了。改變策略嚴格不會使參與人獲得增益,其他參與人不改變行為的前提下,自己改變行為並沒有任何好處。
 
我為什麼把它稱為不反悔呢?因為如果你也參與到賽局中來,這個賽局已經達成了納許均衡,你觀察了一下其他參與人的行為,瞭解其他參與人的行為後,你自問道,我為我的選擇後悔嗎?你的回答會是我不會後悔,因為在當時情況下我採取了最佳對策,因此這應該算是我們學好納許均衡的一個相當重要的動機了。
 
接下來是第二個動機,剩下的動機我們邊講邊提。第二個動機是因為,納許均衡可以被想像成自我實施的信念。上一講我們著重討論了信念,如果我認為門將會撲向這邊,我就應該從另一邊射門,以此類推。不過我們確實沒有深入探討過信念,如果我認為-如果賽局中的所有參與人相信其他人想要保持納許均衡的狀態,那麼大家都不會打破這種均衡,為什麼會這樣呢?為什麼說要是大家想要保持納許均衡的狀態,那麼大家都不會去打破均衡呢?這怎麼解釋呢?誰來回答?請穿紅色上衣的小夥子來回答。
 
學生:因為在納許均衡下,賽局雙方均採取最佳對策。
 
教授:完全正確,這和第一個動機差不多。如果我覺得其他參與人2到N會採用S2到Sn的策略,根據定義,我的最佳對策是S1,實際上我也是納許均衡的一部分,這些自我實施的信念是納許均衡定義的一部分,我們透過回顧上一講的案例,來看看納許均衡是怎麼達成的。我並不是說要重新分析那個案例,我只是想讓大家都能聽懂。
 
上一講我們繪製了一個賽局的圖像,賽局中參與人要選擇自己的努力程度,這一條線代表參與人1的最佳對策,它是參與人2策略的一個函數。這條線代表參與人2的最佳對策,它是參與人1策略的一個函數。這就是我們在上一講繪製的圖像,我們一起來回顧一下。很顯然納許均衡就是這一點,納許均衡就是兩條線的交點,但這和之前提到的動機有什麼關係呢?
 
哪裡體現出了自我實施的信念,抱歉,我寫成參與人1了,應該是2。如果參與人1認為2會採用這個策略,那麼參與人1應該採用這個策略;如果參與人1認為2會採用這個策略,那麼參與人1應該採用這個策略;如果參與人1認為2會採用這個策略,那麼就應該採用這個策略,以此類推,這就是最佳對策的意思。如果參與人1認為2會採用納許策略,那麼他的最佳對策也是採用納許策略。反言之,如果參與人2認為1會採用納許策略,那麼她的最佳對策也是採用納許策略。因此,這就是一個自我實施的信念。如果兩人都相信會這樣發展,那麼事情的確就會這樣發展。
 
哪裡體現出了不反悔這一點呢?比如說參與人1她第二天早上起床,不好意思,應該是他,對吧?他第二天早上睡醒後自問道,我選了S1*,我後悔嗎?但是他知道參與人2的選擇,參與人2選擇了S2*,然後他自言道,在參與人2選擇S2*情況下,這是我能做的最好的選擇了,實際上我選擇了我的最佳對策,因此選擇S1*我一點也不後悔。請注意這一點在其他情況下並不成立,比如說參與人1採用了策略S1,但參與人2卻採取了其他策略,如S2',這時參與人1就會後悔了。參與人1第二天睡醒後自言自語道,我原本以為參與人2會採用S2,實際上她卻選擇了S2',我真後悔自己選了S1,我當時應該選擇S1',因此只有在納許均衡下參與人才不後悔,大家都明白了嗎?這些就是我們對上一講所學內容的回顧和總結。
 
這一講我們將要利用較多的時間來理解納許均衡的概念,並學會如何尋找納許均衡。我得把投影機關掉,好了。接下來,我們來研究一個只有幾個參與人和幾種策略的簡單賽局,我希望以此讓大家學會如何尋找簡單賽局中的納許均衡。先穩紮穩打吧,以後再加快速度。
 
我們從這個簡單的雙人賽局開始研究吧!每個參與人都有三個策略,我們就不來做這個賽局了,這只不過是一個隨機編出來的賽局。參與人1可以選擇上中下,參與人2可以選擇左心右,收益如下:(0,4)、(4,0)、(5,3)、(4,0)、(0,4)、(5,3) 及 (3,5)、(3,5)、(6,6)。如果我們時間充裕倒是可以做這個賽局,但這並不是一個多麼有趣的賽局,所以我看就算了吧!接下來,我們來分析哪種情況是納許均衡,以及如何來找出這個賽局的納許均衡。我們用和之前類似的方法來尋找這個賽局的納許均衡,上一講我們分析的是一個複雜賽局,兩個參與人的策略是連續的,我們在上一講找到了這個賽局中參與人1和參與人2的最佳對策,即參與人1對於參與人2的最佳對策,以及參與人2對於參與人1的最佳對策,之後我們發現兩線交點就是納許均衡。對於這個賽局也這樣分析。首先我們要找出參與人1的最佳對策,具體來說,參與人2選左時,1的最佳對策是什麼?請準備好麥克風,我要開始提問了,有人想回答嗎?這問題不是很難吧!不如讓中間那位女士試試吧!誰離那位女士最近?好。
 
學生:最佳對策是中
 
教授:此情況下參與人1的最佳對策是中,因為4>0且4>3,我們用圓圈把它標記出來。我們把4用綠色圓圈標記出來,這很簡單對吧!我們繼續。參與人2選心時,1的最佳對策是什麼?我們請坐在另一邊的同學回答,請穿耶魯橄欖球隊服的小夥子回答吧!就是他。
 
學生:上
 
教授:很好,上是正確答案,這是耶魯橄欖球隊的又一個勝利啊!因為4>3且4>0,回答得很好。艾爾,你幫我再找一名同學來回答。在參與人2選擇右的情況下,參與人1的最佳對策是什麼?請大聲說。
 
學生:下
 
教授:下。沒錯,下是最佳對策,因為6>5。從中我們可以找出參與人1對應左心右三種不同情況下的最佳對策。順便說一下,注意參與人1的每個策略都是最佳對策,任何策略都不會因為劣勢而被剔除,任何策略也不會因為不是最佳對策而被剔除。同理,我們來看一下參與人2,請準備好麥克風,我們再找幾個人,你想找坐在後排,之前回答過參與人2對於下的最佳對策的那位同學來回答嗎?
 
學生:左
 
教授:穿藍上衣的男士說是左,因為4>3>0。我們換個顏色和形狀,用方塊標注吧!我不是說非得用圓圈或者方塊,如果你喜歡用六邊形也行,隨你了。我先把答案寫在這裡吧!參與人2對於上的最佳對策是左,參與人2對於中的最佳對策是什麼?請這邊的一位同學來回答,大點聲說。
 
學生:心
 
教授:因為4>3>0,所以是心,我用彩色方塊在這裡標注一下,參與人2對於下的最佳對策是什麼?艾爾,請再找位同學來回答。
 
學生:左,我說錯了,應該是右
 
教授:說得很對,因為6>5,我們繼續。我們剛才在計算參與人1最佳對策的方程式,這與上一講的最佳對策圖線是類似的,這裡我們用白色的直線來表示,但我們也可以用綠色的小圓圈來標注,就像這樣。同理,我就不標注出所有的點了,但所有點連起來就是這樣的。後來我們算出了參與人2的最佳對策,和之前一樣,我們用紅色的長方形來表示,我們透過微積分的觀點得出連續策略,不過道理都是一樣的,把它想像成我畫了很多粉色長方形即可。同理,我就不都畫出來了,你喜歡就在筆記本上畫吧,原理一樣的,納許均衡一定是兩條最佳對策圖線的交點,因為在這一點上每個參與人都採取了最佳對策,這個賽局的納許均衡是什麼呢?我們找個人來回答吧!請你前排的一位同學來回答吧!誰想回答呢?穿義大利隊服的那位,就由你來回答吧!這個賽局的納許均衡是什麼?
 
學生:是右下
 
教授:右下那個方格。沒錯,這個賽局的納許均衡就是右下,雖然你答對了,但是沒有獎勵啊!為什麼右下是納許均衡呢?因為此時參與人1採取了最佳對策,而同時參與人2也採取了最佳對策。
 
我希望大家都明白,特別是那些還在為作業發愁的同學,這不像造火箭那麼難,找出賽局中的納許均衡並不難,這並不是很麻煩的,而且我們剛才也是慢慢來分析的。我再來給大家舉一個例子,在繼續講下面的內容前,請注意,我再來強調一點,在這個賽局中參與人1的每個策略是某種情況下的最佳對策,參與人2的每個策略也是某種情況下的最佳對策,因此我們在前幾講學到的方法,即剔除劣勢策略以及剔除非最佳對策的策略,在這個賽局裡是行不通的。因此,納許均衡縮小了我們的預測範圍,但從中我們也學到了一些結論,我們在幾個星期前說到過理性或者理性的相互知識,甚至是理性的公共知識只能幫助我們剔除劣勢策略,以及剔除非最佳對策的策略。
 
我們得出這個賽局的納許均衡是右下,這是一個很詳盡的預測。但請注意,一個理性參與人也可能選中,參與人1之所以選中,可能是因為參與人1認為參與人2會選擇左,那你可能要問,為什麼參與人2會選左?參與人1會說,我之所以認為參與人2選左,因為參與人2覺得我會選上,然後你接著問道,參與人2憑什麼認為你會選上?參與人1回答,參與人2之所以認為我會選上,是因為她覺得我認為他會選心;然後你又會問,為什麼參與人2云云,然後你就陷入了封閉循環中去了。
 
大家都在理性地看待事物,所有東西都可以被信念合理化,但我們卻不能找到萬能解,我們無法找到一個簡單的萬能解。在剛才的右下的情況裡,參與人1認為選下是很合理的,因為他認為參與人2會選右,而參與人2認為選右是很合理的,因為他認為參與人1會選下。我可能講的有點亂了,強調一下,我們不能想當然的、理性地認為人們總會達成納許均衡,達成納許均衡還需要別的條件。
 
誠然,這一講我們要來研究納許均衡。我們不妨再來看一個案例,同樣,為了便於分析研究,我們舉一個雙人三策略的賽局。策略分別為上中下、左心右,這個賽局的收益如下:(0,2) (2,3) (4,3) (11,1) (3,2) (0,0) (0,3) (1,0)和(8,0)。這個賽局不太好分析,這些數字都是我在寫板書時隨便想出來的。同樣,我們要找出這個賽局的納許均衡,我們還要沿用之前的方法。我們需要找出每一個參與人在對手選擇不同策略下的最佳對策,與其說直接寫出來,不如用綠圈和紅方框標注出來。我來找幾個人來回答,準備好麥克風,麥克風在哪裡呢?謝啦!艾爾,你能不能找個人回答,策略左的最佳對策是什麼?隨便找就行,左的最佳對策是什麼?
 
學生:中
 
教授:中是左的最佳對策,因為11>0。米拓,你來找個人回答心的最佳對策是什麼?
 
學生:中
 
教授:還是中,因為3>2>1。再找個人來告訴我右的最佳對策是什麼?後面有人想回答嗎?
 
學生:下。
 
教授:很好,是下。我們同理來分析一下,參與人2對於參與人2來說會怎樣?艾爾,讓你後兩排快睡著的傢伙回答,上的最佳對策是什麼?
 
學生:哪個參與人的最佳對策?
 
教授:參與人2對於上的最佳對策是什麼?算了,我再找一個人吧!沒關係,你身後的人來回答一下,上的最佳對策是什麼?
 
學生:中或右是一樣的
 
教授:這個就有點容易弄錯了,上的最佳對策是心或者右,多虧各位簽了授權書,上的最佳對策要麼是心要麼是右,那中的最佳對策是什麼?
 
學生:心
 
教授:是心,感謝你的回答。下的最佳對策是什麼?
 
學生:左
 
教授:下的最佳對策是左,這次我們沒有花費多少時間,我們已經輕車熟路了。這個賽局的納許均衡是什麼?我們再問問那個差點睡著的傢伙,這次問一個簡單點的問題,這裡的納許均衡是什麼?
 
學生:納許均衡是(3,2)嗎?
 
教授:沒錯,就是中心,注意這個就是此賽局的納許均衡,為什麼它是納許均衡呢?因為每個參與人都採取了最佳對策,如果我是參與人1,我認為參與人2會選心,我就應該選中;如果我是參與人2,我認為參與人1會選中,我就應該選心,實際上,這樣我們就都不會後悔。注意並非每個參與人都獲得了最大收益,比如參與人1其實也想得到11或者8,但是他們都不後悔,因為在參與人2選心的情況下,參與人1最多也只能得到3,這是選中時才能達到的結果。順便說一下,最佳對策不一定是唯一的,有時候也可能有多個最佳對策,這是有可能發生的。
 
那我們從中學到了什麼呢?我們學到了如何找出納許均衡,這顯然與我們幾周之前學到的最佳對策知識點有很大的聯繫,不過我們再回顧一下更早的知識點,想想這個與優劣有什麼聯繫。這就是我們這門課的第三個概念,我們講過了優劣的概念,我們學到了最佳對策的概念,現在我們又學到了納許均衡,我覺得顯然這一點與最佳對策緊密相連,納許均衡就是最佳對策的交點,但是這個和優劣有什麼聯繫呢?我們不妨回顧一下,接下來我們要把納許均衡與優劣聯繫起來。為了聯繫起來,我們當然要回顧一個我們之前見過的賽局。
 
這是一個參與人1和2選α與β的賽局,收益分別(0,0) (3,-1) (-1,3) (1,1),這就是第一講的賽局,即囚徒困境;我們都知道此賽局中-我就不找人來回答了。我們都知道此賽局中α嚴格優於β,這是我們第一講學到的東西。驗證一下,對手選α時你選α得0,選β得-1;對手選β時你選α得3,而選β得1,α嚴格優於β。這當然對於參與人2也是同樣的,因為這個賽局是完全對稱的。
 
下面我們來尋找這個賽局的納許均衡,我覺得我們知道納許均衡是什麼,但我們還是仔細分析一下。α的最佳對策是α,β的最佳對策是α,對於參與人2來說,α的最佳對策是α,β的最佳對策是α,大家都聽懂了嗎?我可能說得有點快,但是這都是顯而易見的吧!因此這個賽局的納許均衡是(α,α),換句話說,就是我們剔除嚴格劣勢策略後剩餘的那種結果了。這是一個α嚴格優於β的賽局,此賽局的納許均衡仍然是交點,即答案是兩個參與人都選擇α。這不是什麼新知識,我的推理到目前為止還沒有錯誤吧!我們再認真一些好了。我們怎麼證明在一個賽局中,嚴格劣勢策略並不能達成納許均衡,比如這個賽局裡的嚴格劣勢策略是β。我覺得這是一個不錯的想法,因為我們希望這兩個知識點有交集,我強調了嚴格劣勢策略無法促成納許均衡,這是為什麼呢?請那位同學來回答。
 
學生:嚴格劣勢策略不可能成為最佳對策
 
教授:很好
 
學生:最佳對策才可能達成納許均衡。
 
教授:說得很對,嚴格劣勢策略永遠不可能成為最佳對策。具體說,優於它的策略總是優於它,因此說嚴格劣勢策略不能達成納許均衡,這是嚴格劣勢策略無法達成納許均衡的一個很好的證明。不過現在我們遇上了點小麻煩,麻煩就是弱劣勢和弱優勢,我們可以理直氣壯地說,嚴格劣勢策略絕對不會在納許均衡裡出現,可是弱劣勢策略卻不然。你們可能預感到了下一次作業會有一道這樣的題,我記得應該是第二題。剔除弱劣勢策略有時候確實挺難處理的,弱劣勢策略不像嚴格劣勢策略那麼好處理。我們來分析一個簡單的案例。
 
這是一個簡單而枯燥的案例,但它卻很能說明問題。這仍然是一個2 * 2的賽局,參與人1可選上下,而參與人2可選左右,收益很簡單:(1,1) (0,0) (0,0) (0,0)。我們來找出這個賽局的納許均衡。我就不叫人回答了,因為太簡單了。參與人2選左時,參與人1的最佳對策是上,如果參與人2選擇右時,參與人1的最佳對策是上或下,因為兩者的收益都是0,這兩個策略都是最佳對策,沒錯吧!因為它們的收益是一樣的。
 
相反,如果參與人1選上,那麼很顯然參與人2的最佳對策是左,我們都比較喜歡這樣的答案,但很不幸的是,如果參與人1選下,參與人2的最佳對策是左或右,二者收益均為0,沒什麼區別。那麼這個賽局的納許均衡是什麼?我們首先發現的是,這個賽局不止存在一個納許均衡,我們以前沒有遇到過這樣的情況,我覺得教室裡的人會達成一個納許均衡,我也希望這是對這個賽局的合理預測,在這個賽局裡,我希望所有的參與人1都選上,參與人2都選左,是這樣吧!促使大家不去選擇左和右的想法似乎都是站不住腳的。
 
不過很不幸,也不能說不幸吧!左上是一個納許均衡,但右下也是,如果參與人2選右,你的弱最佳對策為下,如果參與人1選下,參與人2的弱最佳對策是右,這也是根據納許均衡定義得出來的。它是一個很明確的定義,我把它擦掉了。定義這麼說的-納許均衡就是每個參與人都採取最佳對策的均衡,換句話說,每個參與人嚴格不願改變策略,參與人改變策略嚴格不會獲得增益,比如這個案例中,參與人1選右並沒有獲得額外收益,參與人2改變策略也沒有額外收益,兩個策略的收益都是0。
 
到這裡我們似乎遇到了這門課的難點了,有時候我們不止找到了一個納許均衡,但這並沒有什麼,這是客觀存在的,但是在這個案例中的一個納許均衡很牽強,如果你回去跟你室友解釋說,我預測這些都是賽局的可能結果,你會被嘲笑。某種意義上來說,它應該是合理預測。好了,就說這麼多,我們繼續講課。這些都太正經了,毫無意思。接下來我們講點有意思的吧!
 
我們來看另外一個賽局,我們當然也要找出這個賽局的納許均衡,不過我們還有別的工作要做,我們要來仔細分析一下這個賽局。這個賽局很有特點,它與我們之前的賽局的不同之處是,這個賽局有很多個參與人,儘管每個參與人只有幾個策略,我想透過這樣賽局讓大家明白,如何在像這樣參與人不止兩個的賽局中找出該賽局的納許均衡。所幸的是,每個參與人的策略不是太多,我在這塊黑板上寫板書吧!
 
我們要做的這個賽局叫做投資賽局,我們來模擬一下這個賽局吧!賽局中的參與人是在座的全體同學,那些昏昏欲睡的同學趕快醒醒,你們要參與到其中來了。這個賽局的策略,或者說這個賽局的策略組合很簡單,大家可以選擇分文不投,或者為一個課時專案投資10美元。我們有時把分文不投說成不投資,都聽懂了嗎?這個很好理解吧!你們要麼投資10美元,要麼不投資,現在給出了參與人和策略,我們還沒有給出賽局的收益。
 
收益如下;如果你不投資,你的收益就是0,不勞則無獲,這是個常識吧!如果你們都投資了10美元,那麼你們的收益就是這樣的了。好消息,各位會分得5美元利潤,也就是說,你們投資了10美元,得到了15美元的毛利潤,但是減去之前投資的10美元,淨利潤就是5美元。好消息就是各位能獲得5美元淨利潤,但這要求不少於90%的同學選擇了投資10美元,如果多於90%的同學投資了,那麼你們會獲得50%的利潤。
 
然而壞消息就是,如果投資的人數少於90%的話,你會損失掉原始10美元的投資。賽局的關鍵在於,你們不允許互相溝通,不許用手勢和表情,一切都不行,大家都聽懂了吧?各位都明白這個賽局的意思了吧!首先我要說明的就是,我們只是模擬一下,因為在座有250人,而且我現在也沒有那麼多現金。所以假裝我們在進行這個賽局,不許溝通,請各位在筆記本的邊上寫下你是否會選擇投資,你可以用Y表示投資,N表示不投資,不要互相討論,在你們筆記本的邊上寫下Y或N。投資就寫Y,不投資就寫N,不許討論的。
 
現在給你的同桌看一下,因為你在同桌面前不會說謊。現在請大家舉手表決,我們來看看多少人選擇了投資。誰投資了請舉手,舉手就行了;不投資的舉手,這絕對多於10%啊。我們再來一次,選擇投資的請舉手,不投資的請舉手,我也不知道具體有多少?我猜是一半。看來我們真應該實際進行這個賽局。那我們就來分析一下,我們花點時間來討論討論,這個賽局有很多東西值得分析討論的,把麥克風借我用一下吧!這位同學,請問你怎麼選擇的?
 
學生:我投資了
 
教授:你為什麼選擇投資呢?
 
學生:因為我不缺錢
 
教授:他很富有,那你請我們吃午餐吧!誰選擇了不投資?這裡有一位,請問你為什麼不投資?大聲說出來,讓大家都聽見。
 
學生:我不投資,因為我覺得想要獲得利潤,90%的人投資與否的比率至少是2:1。
 
教授:你的意思是說計算預期利潤嗎?
 
學生:你可能獲得一半利潤,但也可能一無所獲。
 
教授:我明白了,你計算了預期收益,還有別的理由嗎?你怎麼選擇的?
 
學生:我投資了
 
教授:我本來想找不投資的傻瓜的。好吧,那你說說為什麼你投資了?
 
學生:只有付出才會有回報,我不理解為什麼有人會選擇不投資,因為不投資就沒有回報啊!
 
教授:請問你叫什麼名字?
 
學生:克雷頓。
 
教授:克雷頓說只有投資了才會有收益,不投資的話顯得缺少魄力。還有誰想回答?
 
學生:這個和之前(1,1) (0,0)的賽局差不多,因為都有兩個納許均衡,但兩個均衡的收益是不同的,要是你選擇不投資,你太害怕風險了,所以我覺得...
 
教授:這麼說你投資了?
 
學生:是的,我投資了
 
教授:在我把音響系統弄壞以前,我趕緊把麥克風還給艾爾吧!我們得到了不同的理由,大家是不是都聽清楚了?關於是否應該投資大家各有見解,差不多一半的人選擇投資,另一半的人選擇不投資,他們的理由也都能自圓其說,我們以後再來討論,這個和之前的賽局是否是一樣的。剛才的那個說法...抱歉,忘記了你的名字。派翠克認為這個和之前的賽局很相似,它們二者確實聯繫緊密,接下來我們看看二者到底有什麼聯繫?這個賽局裡的納許均衡是什麼?讓這位女士回答一下。
 
學生:無人投資,無人受損失,皆大歡喜。或者每個人都投資,大家都受益了。
 
教授:說的不錯,請問你叫什麼名字?
 
學生:凱特
 
教授:凱特說有兩個納許均衡。辛苦了,裘德,我還是回到講臺上吧!這個賽局有兩個納許均衡,一個是都投資,而另一個是都不投資,所以說有兩個納許均衡,我們來驗證一下是不是和凱特說的一樣。如果每個人都投資,那麼無人會後悔,這種情況下,每個人的最佳對策是投資;如果無人投資,選擇不投資也很合理,因為是最佳對策,這和派翠克說的一樣。這個賽局和之前的一樣,有兩個均衡,除此以外,二者還有別的相似之處,但怎麼說好呢?兩個賽局的納許均衡並不完全相同,在之前的那個賽局裡,(0,0) 這個均衡似乎很不合理,我們都不覺得這種情況會發生。然而這個賽局中,無人投資也是一個很合理的均衡,如果我認為沒有人會投資,那我絕對會選擇不投資。這裡面有兩個重要內容,講重點之前,我還需要解釋一下嗎?這就是第一個重點,我們如何尋找納許均衡?在尋找這個賽局的納許均衡時,我們用到了哪些複雜的數學方法?請準備好麥克風並遞給凱特,請問你是怎麼找到納許均衡的?
 
學生:我只找到了兩處不會後悔的結果
 
教授:原則上來說,你的方法是可行的,不過準確說,你應該考慮了各種情況,這裡有很多可能的情況,可能是1%選擇投資99%選擇不投資,也可能是2%比98%,以此類推。我們可以很準確的推算出不同情況下,每個人的最佳對策是什麼。那麼這個賽局最後的結果會是什麼呢?用什麼方法推算?你來回答吧!
 
學生:你只需要考慮你的行為能改變結果的情況,只有兩種情況,都投資或都不投資。
 
教授:的確是這樣,這樣問題變得簡單了,很好,我覺得他們兩位同學比我分析得更嚴謹,更有數學邏輯性,我覺得簡單的分析方法就是去猜測,我要猜測的東西很簡單,我只需要猜測均衡會是什麼樣的,然後再驗證一下即可。因此,分析這些賽局可以先猜測後驗證,這不失為尋找納許均衡的好方法,因為驗證過程很簡單易行,猜測可能比較困難,難免會有疏漏。可能會有一個隱含的納許均衡,在美國你們都說隱藏吧,可能會有隱藏的均衡,儘管如此,驗證過程中,無論假設的還是客觀的均衡,驗證它們到底是不是均衡很簡單,因為你只需要驗證參與人都不想改變策略,實際上這就是賽局最終的結果,這一點是比較容易猜測並驗證的。因此我們可以找到均衡,先猜後證的方法,在分析這樣參與人的數量很多,但策略不多的賽局時很有效。
 
這個賽局已經寫在黑板上了,因為它很重要。我們再討論一會,我想請大家再回憶一下剛才的賽局,那個賽局是什麼內容?請剛才投資的同學再舉下手,不投資的請舉手,沒舉手的人你們都欠我10美元啊!我們再來進行一次這個賽局吧!不許交流,請在筆記本的邊緣寫上你的選擇,不許說話,寫完了給同桌看看。我們再舉手表決一次,大家準備好,不許作弊,不許左顧右盼,讓裘德把鏡頭對準你們,如果你選擇投資請舉手;不投資的請舉手。投資的請再舉下手。看來還有幾個人選擇投資啊!那你們就真要欠我錢了啊!
 
我們再來進行第三次賽局。準備好,這次假裝要玩真的了,寫出你們的選擇。這次投資的請舉手,這世上還真有這麼執著的傻瓜呀!我們不斷重複,最後會趨近於什麼?我想讓大家都清楚,我們趨近於均衡。第三次選不投資的請舉手,這次就很接近了。舉手表決結果很接近一個納許均衡,是這樣吧!這就是我們上一講第三個理由的一個不錯的例證,這便是我們學習納許均衡的第三個原因。有些情況下,賽局會朝著趨向於一個均衡的方向自然發展,除了那些有錢願意請我吃午餐的老頑固,其他參與人都會趨向於一個均衡。賽局的結果會不斷趨近於納許均衡。
 
但我們討論得出,此賽局有兩個納許均衡,這兩個納許均衡當中,有哪一個優於另一個嗎?很顯然大家都投資這個納許均衡較好,大家都同意這點吧!大家都投資比起大家都不投資來說,是一個較好的納許均衡,沒錯吧!然而,我們進行這個賽局時趨向哪個了呢?我們趨向於較劣的納許均衡了,我們不斷地趨向於一個沒有人獲得利潤、投資都變成損失的均衡了,怎麼會這樣呢?我們怎麼會趨向於這個較劣均衡呢?說得正式一點,這個較劣的不投資的均衡相對於較優的納許均衡,處於帕累托劣勢。在較優均衡中,參與人的收益嚴格優於較劣均衡中的收益。用150或115的術語來說,這叫帕累托優勢,但是我們還是趨近於較劣均衡了,我們達成了那個較劣均衡。為什麼最後我們趨向於較劣均衡,而不是較優均衡呢?請穿灰上衣的小夥子回答。
 
學生:這對投資者來說是空頭市場,難道不是嗎?
 
教授:這個怎麼講?請你再多說點,解釋一下你的想法。
 
學生:大家對於其他人會投資不抱有太大的信心
 
教授:換種說法就是,最開始大概是均分的,這對那些投資的人是很不利的。我們開始時是各占一半,投資的機率低於90%的臨界值,對吧?從此以後就發生了巨變。這個思路的意思是說,初始狀態可能會影響結果。假如我們第一次進行這個賽局的時候,93%的人選擇了投資,這種情況下93%的人會賺到錢,雖然我無法給出證明,但是我猜我們會趨向於另一個均衡,最終會達到較優均衡,這樣說得通嗎?人們發現,第一次不投資的人實際上採取的是最佳對策,他們按兵不動,而那些投資的人開始時,很多人都不投資,然後大家陷入不投資的漩渦,最後也就沒人投資了。但如果我們開始時投資機率高於90%的臨界值,假如你們第一次就賺到錢了,那些選擇不投資的人可能就會後悔,然後可能會轉而選擇投資,然後我們可能會趨向另一個均衡。我並沒有說一定會,我只是說可能會。請把麥克風遞給他。
 
學生:如果只有70%選擇投資會怎樣呢?
 
教授:這是個很有水準的問題。如果剛開始接近但是低於臨界值,我也不知道情況會怎樣,我沒有做過類似的實驗,不過應該是越高的投資率、越接近臨界值的話,越可能趨近於較優均衡。我只是猜測一下,如果初始值小於臨界值會趨近較劣均衡,如果初始值高於臨界值會趨近較優均衡。但這可不是定理,我只不過是推測一下情況會怎麼發展,是根據你的推測再繼續推測。這個賽局有兩個均衡,一個較優一個較劣,較劣的那個處於帕累托劣勢。
 
我們再來回顧一下。我們不斷趨向於一個均衡,正好和之前說的納許均衡的一個特點相符,那就是關於自我實施的預測。如果你認為別人都不會去投資,你就不會去投資,自我實施的預測阻止你去投資;相反,如果你認為人們都會選擇投資,那麼大家就會達成較優的均衡。我覺得這和之前坐在中間的先生說的有關,就是關於空頭市場還是多頭市場的觀點。如果是空頭市場,人們對於其他人選擇投資並不抱有信心,由於這是一個自我實施的預測,最後導致大家都不去投資了。
 
我們早就見過這樣較劣結果的案例,比如第一講中的囚徒困境。我強調一下,雖然我們得到了較劣結果,但這並非是囚徒困境,為什麼這不是囚徒困境?它們是有不同之處的,儘管兩個均衡的收益都是較劣。囚徒困境的較劣均衡導致的結果是,大家都不去打掃房間或者都要坐牢。但這個賽局的較劣均衡不是囚徒困境,請你後面的人來回答一下。
 
學生:沒有人活受罪,但也沒有人獲得收益
 
教授:或許結果也沒那麼糟。你說得很對,我可以把結果編得更糟糕的,我可以讓收益降到非常低,還有別的理由嗎?你後面的那位女士。
 
學生:因為這裡沒有嚴格劣勢策略
 
教授:在囚徒困境中選α永遠是最佳對策,之所以在囚徒困境中會得到較劣結果,是因為保守策略、非合作策略。不打掃房間的策略α總是最佳的策略,這個賽局裡的較好較道德的做法是選擇投資,但這不等同於說不投資優於投資。實際上,如果所有人都投資你也應該投資,沒錯吧?這是個社會問題,但這可不是社會問題的囚徒困境。那這是一種什麼樣的社會問題呢?請你前面的同學回答。
 
學生:這可能是一種合作問題
 
教授:沒錯,如果人們合作結果會更好,但我們來換一個說法,我們用第一天講到的術語-協調。這是一個協調賽局,為了使那些紐約客的讀者習慣,我在讀O的時候變音了,為什麼說這是一個協調賽局?因為我們希望教室裡的每一個同學透過協調都選擇投資,實際上,如果協調成功就會皆大歡喜,而且沒有人會變卦,這樣我們就達成了一個均衡。然而,不幸的是,我們總是協調失敗。要麼大家都不投資,要麼和第一講一樣,大家存在分歧,使有人要蒙受損失。
 
我認為這種情況在社會上並不少見,現實生活中有很多協同謬誤。很多事都像協調賽局一樣,而且協調賽局經常導致較劣的結果。所以我們多花點時間來探討一下,因為我認為這對你很重要,不管你是不是經濟學家。好了,我們開始探討吧!哪些情況是協調賽局能導致如下的後果?如協調失敗,或者協調的方向有問題,而最終達成了較劣均衡呢?我們來找幾個案例,後面有人舉手了,請把麥克風遞到後面去-對,就是那裡,感謝,等麥克風到了再大聲說。
 
學生:在校園裡的派對是一種協調賽局
 
教授:對,校園派對是一種協調賽局,因為大家需要協調好去一個地點,對嗎?你是這個意思嗎?請繼續說。
 
學生:是這樣的,如果參加的人不多,那麼參加聚會的人玩得並不快樂。但參加的人很多,大家都會玩得開心。
 
教授:這是個不錯的想法,派對有兩方面可能出現協同謬誤,一個是參加的人要是不多,沒有意思,因此你也就不想參加;相反,如果參加的人很多,就很有趣,這樣大家就都想參加了。第二點是-這裡也有兩個均衡,大家都參加或者都不參加。同樣,派對的地點-我以為你要說的是這個呢。這也是一個類似的協同謬誤。
 
在紐黑文曾經有很多酒吧,但現在可能不多見了。曾經在校園附近有很多不同的酒吧,但是你們都不允許去酒吧,但反正事實是,學校周圍有很多酒吧,大家想協調好在週五晚上到酒吧聚會,研究生們通常安排在週四晚上,這些在商業區的酒吧有一家是戲劇學院的據點,另一家是經濟學院的據點,而且他們沒有聚到同一個據點,看來這個還真是個不錯的均衡。你們到了一座陌生的城市,首先要知道哪裡常舉行你喜歡參加的派對。當然你們也可能會協調失敗,大家各玩各的,然後不小心遭到打劫了。還有別的協同謬誤的案例嗎?坐在後面角落的-就是他。
 
學生:內戰時交戰中的黨派簽協約算不算?
 
教授:這也可以算作一個協同謬誤,這在某種意義上和囚徒困境類似,我先解除武裝,然後你也要解除武裝,這算一個吧!這也是一個協同謬誤,但這個也有些囚徒困境的意味。很好,繼續說,還有其他例子嗎?那位同學-就在你周圍,就是門旁邊的,對,就是他。
 
學生:在大型體育賽事中,人們在考慮到底給哪個隊伍呐喊助威。
 
教授:我不知道這是個較優結果還是較劣結果,這就是傳說中的揮手致意吧!既然美國人堅持揮手致意,我猜他們認為那是個較優結果,對嗎?還有其他的案例嗎?
 
學生:性別之戰
 
教授:我們以後再來考慮這個問題,先保留這個想法,下一講我們再來討論。你說的是個不錯的案例,下一講再討論,還有其他的嗎?那我們再深入研究一下會面地點吧!我們討論過在酒吧碰面或者在派對碰面,但就是沒說過網站。比如那些聊天網站或者交友網站,這些網站和派對的作用其實是差不多的。你希望大家都協調好去同一個網站,那有沒有經濟學裡的案例呢?誰能想到一個經濟學的案例?除會面地點以外,還有沒有別的外部效應?
 
學生:我覺得除了剛才他們說過的,報紙之類的應該是相關的案例吧!可能我們都只需要一個全球新聞網就夠了。
 
教授:有趣的想法,而且兩面還都說得通。只有一份報紙的壞處是顯而易見的,但從另一個方面來看,當午餐後大家坐在一起討論時,這倒是能讓大家找到聊到一起的話題。當然了,看電視劇也有從眾效應的。如果所有美國人都看同一部電視劇,比如說這幾天大紅大紫的美國偶像,那你們共進午餐時就有聊天的話題了。不過請注意,這可不是什麼好協調的,美國偶像這樣的例子多得很。我小時候在英格蘭生活時-看來我又要暴露自己的年齡了。那時候大家都想成為潮人,那你就要穿喇叭褲,喇叭褲可是每個潮人的必備,這是一個多麼可怕的潮流啊!你們要是不信在英國也有這麼滑稽的潮流,那你們回想一下,是不是在美國也有過這樣滑稽可笑的潮流呢?你要是還不相信,想想美國中西部,我可什麼都沒說,把這段剪掉別播出啊!還有別的案例嗎?請這位先生說說你的想法。
 
學生:比如微軟壟斷的形成過程。每個軟體都和微軟的系統相容,所以以後就有更多的人用了。
 
教授:好想法,我忘了你叫什麼了?
 
學生:斯蒂文
 
教授:斯蒂文的意思是,一種軟體可能會帶來循環效應,越多的人使用微軟的軟體產品,我使用微軟產品的優勢就更明顯。我可以安裝不同的程式,我可以跟合夥人交換檔案,可以協調達成使用不同軟體的各種均衡,當然你也可能達成了較劣的均衡。很多人對此頗有微詞,但我保持中立。很多人都認為微軟的產品不是最好的選擇,這樣的連帶產品多得很,這些都屬於連帶外部效應。比如我們舉高畫質電視這個例子,我們需要制定一個統一的技術標準,這樣大家都會遵循此標準,因為如此,大家都可以生產符合標準的電視及周邊產品了。當然,每家公司都希望自己的產品標準成為行業的通用標準,我們同樣可能會選擇不合理的標準,或者說達成了較劣的均衡。那政壇選舉呢?在政治領域,尤其是初選的時候,無論是民主黨還是共和黨,初選時集中投票給一個候選人大有益處,因為這樣能夠加快黨內選舉,而且顯得黨內意見很統一。對此我同樣表示中立,但這樣可能會導致不合適的候選人勝出,這就是政治上的潮流效應。誰贏了新罕布夏和愛荷華誰就獲勝了,這也是一個案例。還有別的經濟學案例嗎?請那個小夥子來回答。
 
學生:證券交易所
 
教授:具體說是掛牌交易的證券交易所。在一家大型證券交易所裡,有大量的證券交易是很有優勢的,這樣可以分攤固定成本。當然這也考慮到了流動性和其他的問題,但主要考慮的還是固定成本的問題。趨勢是,最後會只有一家證券交易所,我們現在還沒有到這一步,但這只是時間的問題了。可是這未必是家有實力的證券交易所,或者會導致該交易所獲得壟斷力量。我再舉幾個例子吧!比如說銀行擠兌的案例,什麼是銀行擠兌?誰來回答一下?
 
學生:銀行擠兌就是公眾們對於銀行失去信任,擔心自己存在銀行資金的安全,蜂擁而至去提款。
 
教授:我們可以很自然地把銀行看成是有兩種均衡的,較優均衡是大家對銀行抱有信心,紛紛把錢存到銀行裡去,然後銀行就可以把其中一部分資金以更高的利率貸出去-銀行可不喜歡把錢都鎖在金庫裡面,他們希望把錢貸出去收利息。對於每個人來說,這是一個較優均衡。
 
但是如果人們對銀行失去了信心,開始瘋狂的提款時,銀行金庫沒有足夠的現金來兌現,這樣銀行就要關門了。我以前總在課堂上講,你們誰也沒見過銀行擠兌是什麼樣的,因為差不多30年代中期以後再沒發生過,這在19世紀30年代以前的美國經常發生,但自從聯邦存款保障體系建立後,這種情況基本就沒發生過了,不過我可不敢保證以後也不會發生,因為現在就有一樁銀行擠兌事件。
 
我說的銀行擠兌發生在英國,有一家叫北岩銀行的金融機構就被擠兌破產了,不信你回去看昨天的紐約時報,就會看見報導說,在這家銀行的倫敦支行門外,人們排起長隊蜂擁而至來提款,英格蘭銀行試圖干預並恢復人們的信心。但請注意,這可不是那麼簡單的,這不是抵押貸款危機那麼簡單。這家銀行的確有抵押貸款業務,但並不是由於抵押貸款業務經營不善而引起了公眾的注意。實際上就是公眾對這家銀行信心不足。較優均衡下,人人都來存款;較劣均衡下,大家就都來提款。在美國電影裡也講過銀行擠兌,在哪部電影裡面講過銀行擠兌呢?
 
學生:是在《風雲人物》裡面講過
 
教授:當然在《歡樂滿人間》裡面也講過,但你說《風雲人物》也沒錯,有多少人看過《風雲人物》?誰看過《風雲人物》這部電影?我看看大概多少人沒看過,先不要放下手。大家請記住,如果你持有綠卡,快去看《風雲人物》,不然會被吊銷的。《風雲人物》裡面的銀行擠兌案例,其實說的只不過是存款取款的事兒,但無所謂了,就把它當做一家銀行吧。所幸的是,電影裡面的銀行沒有倒閉,為什麼《風雲人物》裡面的銀行沒有倒閉?為什麼它沒有倒閉呢?穿綠衣服的小夥子你來回答,請把麥克風遞給他好嗎?
 
學生:大家達成一致,只取出日常開支,不要取出全部的存款。
 
教授:有些人可能沒聽見,我來重複一下。人們達成一致,只取出小額的生活開支,有的甚至不取了,銀行擠兌就結束了。人們後來發現銀行不會破產,他們就又把錢都存到銀行裡了。人們確實達成一致了,是什麼原因讓人們恢復信心了呢?這多虧了詹姆斯·史都華的功勞,大家還記得這部電影吧?詹姆斯·史都華站出來,做了一個演說,他可能不會像我這麼跟大家解釋,但是如果他學過這門課,他就會這麼說-他會說這裡有兩個均衡。我不會學賓夕法尼亞州西部人的口音,但反正這裡有兩個均衡,大家都提款的均衡是較劣的均衡,最後會導致大家一無所有;大家仍然把錢存在銀行是較優均衡,這對每個人來說是較優的,所以我們還是把錢存到銀行吧!我覺得他說得應該比我說得更鼓舞人心,最後大家還是又把錢存進銀行了。
 
那我隨便來叫一名同學提問,看看是不是大家都聽明白了。這裡面存在兩個均衡,一個較優另一個較劣。我們再來進行一次這個賽局,我們再做出自己的選擇,但開始之前,我先把麥克風給派翠克,給他五秒鐘來說服各位投資,請起立吧!派翠克將用五秒鐘的時間,用他的方法說服大家來投資。
 
學生:很顯然,如果我們都投資,就會有所回報,所以請大家都投資吧!
 
教授:那好,我們看看是否起到了效果,我們看看接下來結果會怎樣?選擇投資的同學請舉手?選擇不投資的請舉手?我們差不多成功了,我們差不多說服了所有人來投資,那這到底是怎麼回事呢?請大家再給派翠克一點掌聲,他做得很棒。從中我們可以總結出一條結論,結論就是這個賽局本身並沒有改變,這個就是我們進行了三次的賽局,而且這是我們第四次進行了,但是這次大家的選擇卻和以前不同,絕大多數的人,應該是超過90%的人都選擇了投資,看來派翠克的演說起到了作用。只不過派翠克並沒有出資,沒有賄賂你們,也沒有簽合同,也沒有威脅說要打斷你們的腿。他只是說這樣做是明智的做法。讓我們回憶一下囚徒困境。如果在囚徒困境中,派翠克跟大家說,在囚徒困境裡面,如果我們都選β,要比選α更好-差不多就是這樣的說法。你們處於囚徒困境中會怎麼做?你們還是會選擇α。派翠克想要說服大家,他想跟大家溝通,並告訴大家,在囚徒困境裡選β會更好,但這毫無效果。還沒下課呢!但溝通在這裡卻有效。為什麼?這個賽局裡派翠克能說服大家,但在囚徒困境裡卻不行呢?請把麥克風給凱特好嗎?為什麼此賽局中他能說服大家,而之前不行?
 
學生:因為他並沒有勸大家選嚴格劣勢策略
 
教授:因為他並沒有勸大家選嚴格劣勢策略。除此以外,他想讓大家怎麼樣?想讓大家達成納許均衡,從中又可以總結出一條結論。協同謬誤和囚徒困境不同,它和囚徒困境不一樣。僅透過溝通而非簽署合同就可以改善結果。具體說,我們可以說服大家共同去達成另外一個納許均衡,這就又為達成納許均衡提供了合理的動機。想要化解囚徒困境就必須簽署合同,需要單邊轉移支付,我們必須改變賽局的收益,但納許均衡是自我實施的協約,納許均衡本身就有強制力。這個賽局裡,我們大家都選擇投資,我們確實不需要單邊轉移支付,不用威脅別人,也不同簽署合同,更不需要訴諸法律。我感覺派翠克也沒有那麼暴力,我們最後會做出正確的選擇,因為這符合自身的利益。協同謬誤在現實中並不少見,小到銀行擠兌,大到市場泡沫,甚至還有中西部的時尚。總之包羅萬象,溝通能夠起到很大的作用,我們下週一再來繼續學習。
 
 
講座6-納許均衡:約會策略和庫諾模型
 
 
第六講概述:
我們首先將納許均衡的概念應用在更多的協調賽局上,特別是性別戰爭。然後,我們分析了不完全競爭廠商之間經典的庫諾模型。我們瞭解到,在不完全競爭廠商間維持私下協議的困難,並將壟斷和完全競爭的狀況做比較,討論了庫諾均衡的優劣結果。
 
閱讀作業:
杜塔著《策略與賽局:理論與實務》第六至七章
喬爾•沃森著《策略:賽局理論簡介》第十章
迪克特及奈爾巴夫著《策略性思考》第九章,第5節
 
資源:
 
講座6-納許均衡:約會策略和庫諾模型
 
2007年9月24日
 
Ben Polak 教授:上一講我們講到了投資者賽局,這屬於協調賽局,從中我們學到了不少東西,我們回顧一下上一講的內容。我再強調一下,從中我們瞭解到了溝通在協調賽局中可以起到作用,我記不清是誰了,他今天可能沒有來,或者坐別的地方了。就是上一講的詹姆斯•史都華,他只是告訴大家你們應該怎麼做,就使你們達成了較優的均衡。
 
從中我們學到了兩個結論。第一,協同謬誤與囚徒困境不一樣。在第一講裡我們就學到了在囚徒困境中溝通不起作用,但是在和囚徒困境具有同樣重要社會意義的協和謬誤中,溝通卻能夠起到作用,因為你們都想透過協同達成納許均衡。我們可以這樣理解納許均衡,把它們想像成自我實施的協議。假設每個人都相信大家都會遵守協定,那麼大家就都會遵守。
 
第二條結論就是-我不妨說得稍帶些哲學的意味,這和領導力是緊密聯繫的。領導力這個詞最近一直都很紅啊,我們經常能在報章中看到它,在耶魯大學的課堂裡也能經常聽到。我不敢說對領導力有多麼深刻的見解,我也不認為賽局理論能夠幫助大家加深對領導力的理解,可至少能知道它在什麼場合有用武之地。在協調賽局中,領導力的作用就是促成人們達成某個特定均衡,而不是其他均衡,甚至是完全缺乏協調的混亂狀態。在這類賽局中領導力的作用舉足輕重,微小的領導力也能帶來很大的改觀,所以這些協調賽局就是領導力的用武之地。
 
不妨再舉一個例子,我們就不找上一講那麼複雜的案例了。看一下這個簡單的協調賽局,如(1,1) (0,0) (0,0) (1,1),很顯然協調能起到作用,你們希望透過協調能夠達到左上或者右下的結果,而不是左下或者右上的結果。大家都看明白了嗎?如果你們真的進行這個賽局的話,很可能就會協調失敗。可是如果你有一點領導力的話,你可以說我們合作達成這個結果吧!或者我們達成這個結果也行,因此說領導力非常重要。我不想再過分的強調它的重要性,不過我們不妨回顧一下幾年前卡崔娜颶風的災後過程,就會認識到缺乏協調溝通是多麼可怕。
 
在繼續講下面的內容前,我再多說幾句。上一講的投資賽局有一個特徵,就是如果你越認為大家會投資,你就越想投資。你越覺得大家都會投資,你投資的機率就越大。再往前回顧一下。我們之前還講過合夥人的賽局,就是參與人共同參與一個合作專案,可能是一家律師事務所,也可能是一起做作業的學習小組。
 
不知道你們還記不記得最佳對策是什麼了?這條線代表參與人1的付出,這條代表參與人2的付出,這是參與人1的最佳對策,而這是參與人2的最佳對策。這個賽局也有這個特徵,別人越努力你就會越努力,你的合作夥伴付出越多努力,你也就越想付出越多努力。在這兒我們引入一個術語,這種別人付出越多你就付出越多的賽局,叫做策略互補賽局。這些都是策略互補賽局;投資賽局以及合夥人賽局都是策略互補賽局,我們可以說參與人的策略互補,我們一會兒再來討論這點。
 
在我們結束講解協調賽局前,再來看一個稍微複雜點的問題,上一講我簡單提到過的。請大家看下一個賽局,我們就稱它為一起看電影吧!我一直都覺得這門課還有個目的,就是教耶魯的倒楣蛋們怎麼約會,這還真是一個善舉啊!有多少人是經濟學專業的?看來有那麼多同學需要跟我學習約會策略啊!好吧。一對情侶要去電影院約會,我們來看看有哪些影片在上映,我畫一下表格。有三部電影在檔期,分別是《神鬼認證:最後通牒》、《特務風雲:中情局誕生秘辛》和《白雪公主》,我一會兒再詳細說。
 
在我有孩子之前,我能列出15部熱映的影片,我還能給你們提供不錯的影評,幫助各位制定約會策略。但現在我當爸爸了,我每年只能看兩部電影,我今年看的兩部就是《神鬼認證:最後通牒》和《特務風雲:中情局誕生秘辛》。我才發現這兩部影片麥特•戴蒙都參演了,我妻子選的-我是不是需要健身了啊?我給你們介紹一下這兩部電影吧!有多少人看過《神鬼認證:最後通牒》?不少人看過啊!這是一部幾乎沒有情節的動作大片,如果非要說點觀後感的話,那就是間諜都是神經病。
 
有多少人看過《特務風雲:中情局誕生秘辛》?也有很多人看過啊!很好,這部影片武打少情節多,和前一部剛好相反。這部電影的觀後感就是,耶魯人都是間諜,而且都是神經病。第三部《白雪公主》,我還沒有看過,但我4歲的女兒在27個晚上看了24遍,這部電影我真不知道怎麼推薦給大家,也許我已經老了吧!但我可不覺得現代的女性四處遊蕩,等待你的白馬王子出現是個好策略。順便說一下,要是你們有人會採用這個策略,就殺了我吧!如果你真的採取這個策略-記住這句英國的俗語吧!王子和土司一樣蠢,不值得你去等的。
 
我來把收益寫出來。兩個人想要在電影院碰面,他們想一起去看電影。他們想要找一家電影院約會,當時這三部電影正在上映,他們想到要一起看電影都很興奮,雖然那些經濟系的木頭不太會約會,他們忘了告訴對方去看哪一部影片了。他們約好在電影院最後一排見面,但忘了告訴對方看哪部電影了。問題就在這裡,我先寫完收益,先把相應的收益寫下來。這和我的偏好差不多,一會再說這些偏好是什麼意思。
 
(0,-1) (-1,0) (-1,0),(-2,-2),這些是參與人1和2對於影片的偏好,從這些偏好和收益可以得出,參與人1最希望的結果是,兩人一起去看《神鬼認證:最後通牒》。這是一部動作片-無性別歧視。假設這是女方,這是男方,她就想看麥特•戴蒙把敵人打得落花流水。她很希望透過協調能一起看這部電影,如果協調失敗了她就沒有收益。她的備選是看麥特•戴蒙扮演耶魯間諜,她可一點也不想看《白雪公主》。對於他們兩人來說,最糟糕的結果就是兩個人協調好一起去看《白雪公主》,因為你喝咖啡時都不好意思提這事兒。
 
另外一個人的情況是一樣的,唯一不同就是他更愛看《特務風雲:中情局誕生秘辛》,因為他是耶魯人,他把自己當成麥特•戴蒙扮演的特工了。如果不成,他就希望去看《神鬼認證:最後通牒》。如果協調失敗,兩人各看各的,就也是個悲劇了。他們兩人的偏好就是這樣的。如果你遇到這種情況會怎麼辦?關於這個賽局,你馬上想到了什麼?最容易想到的是什麼?穿紅衣服的小夥子。
 
學生:《白雪公主》是二者的劣勢策略
 
教授:沒錯,《白雪公主》是劣勢策略。這兩名參與人都學過賽局理論,我都說了,這對你們約會有幫助。因此兩人都知道,至少沒人會去看《白雪公主》,雖然這部動畫很好,但顯然不適合約會看。把它剔除了。大家都看明白了吧?現在只剩下兩種選擇了,兩部由麥特•戴蒙主演的影片,《神鬼認證:最後通牒》和《特務風雲:中情局誕生秘辛》,這些就是剩下的收益了。我們看看該怎麼做出選擇。找幾個人來回答一下,艾爾你來找一個吧!凱已經找到一個了,好吧,你們每人找到了一個同學啊!艾爾找的那位同學請站起來,你叫什麼名字?
 
學生:妮娜
 
教授:請大點聲說
 
學生:妮娜
 
教授:是安娜嗎?大點聲,我沒聽見。
 
學生:妮娜
 
教授:妮娜,抱歉,我說錯了。妮娜和凱找的同學請起立。請問你叫什麼名字?
 
學生:大衛
 
教授:大衛。你們認識嗎?
 
學生:不認識
 
教授:那你們兩個就去約會吧!妮娜的偏好就是參與人1的偏好,她最希望和大衛一起看《神鬼認證:最後通牒》。大衛扮演參與人2,他最想和妮娜一起看《特務風雲:中情局誕生秘辛》。請你們各自在筆記本上寫下你們的選擇,讓助教監督一下,以防你們溝通好了。二位都寫好了嗎?我們來看看他們怎麼選的吧!我想大家都迫不及待了。妮娜,大聲的對大家說,你選擇去看哪部電影啊?
 
學生:《神鬼認證:最後通牒》
 
教授:《神鬼認證:最後通牒》。那大衛你呢?
 
學生:我也選《神鬼認證:最後通牒》
 
教授:太棒了,你們協調成功了。從大衛和妮娜的協調中得不出什麼結論,這事兒還沒結束呢!很好,我們協調成功了,我們都擔心可能會協調失敗呢!接下來給這個賽局加點交流吧!我們說過溝通在協調賽局中起作用,我們再來進行一次這個賽局。假設你們又要一起去看電影,由於種種原因,第一天晚上你們都沒有看成,假裝因為有一個人感冒了,現在你們約好了週五晚上一起看電影,你們可以先溝通一下。大衛你來吧,你覺得最好事先能聯繫穩妥,所以你就給妮娜打了個電話,你會對她說點什麼呢?
 
學生:看來你想看《神鬼認證:最後通牒》,如果你固執己見毫不動搖的話,那我就陪你去看《神鬼認證:最後通牒》吧!這總比約會失敗要好吧!
 
教授:我再提醒你一句,第一次約會用固執這個詞似乎不太好吧!妮娜,你會怎麼回答呢?
 
學生:那我就去看《神鬼認證:最後通牒》
 
教授:好吧,寫下這次你們會怎麼選擇。妮娜,你選了什麼?
 
學生:《神鬼認證:最後通牒》
 
教授:那大衛呢?
 
學生:《神鬼認證:最後通牒》
 
教授:你們又協調成功了,感謝這對情侶,給他們點掌聲吧!過會我會再提問你們,但是現在我要繼續講課了。在這個賽局中,交流起到了作用,但是能說這和上一講的賽局一樣嗎?交流並沒能直接給出解決的方案。在這個賽局中,交流更困難一些,為什麼呢?剛開始不是很好嗎?問題出在哪呢?為什麼這個賽局更難一些呢?助教們請拿著麥克風。為什麼這個賽局更難協調?
 
學生:這裡的最佳對策是納許均衡嗎?
 
教授:問得很好,我們一會兒再來回答。從這個問題開始吧!這個賽局的納許均衡是什麼?誰願意回答?找個同學來回答吧!這個賽局的納許均衡是什麼?
 
學生:兩人都選擇《神鬼認證:最後通牒》或者都選擇《特務風雲:中情局誕生秘辛》
 
教授:很好。實際上,如果我們仔細看一下這個賽局,就會發現它們的納許均衡就是最佳對策,即兩個人都去看《神鬼認證:最後通牒》,或是兩人都去看《特務風雲:中情局誕生秘辛》。原因是,如果別人選《神鬼認證:最後通牒》,那我妥協吧!如果別人選《特務風雲:中情局誕生秘辛》,我也妥協,兩人就這樣達成了納許均衡。這不是什麼問題,上一講的賽局案例也是這樣的。那個賽局有兩個納許均衡,儘管一個比另一個更好些,但是這個賽局有什麼不同呢?它有什麼特別之處嗎?那邊有麥克風嗎?有位同學舉手了,請起立。
 
學生:每個參與人偏愛不同的納許均衡
 
教授:沒錯,這和之前的賽局不同。目前為止,我們看到的前兩個案例是純粹的協調賽局,它們是僅僅是協和謬誤,其中不存在任何利益衝突。比如上一講投資賽局中,每個參與人都偏好同一個均衡,但是現在討論的這個小案例呢?到底達成哪個均衡並不重要,重要的是我們要達成均衡,是這樣吧?但是這兒有個潛在的衝突。每個參與人都覺得達成均衡總比協調失敗要好得多,但是參與人1想看《神鬼認證:最後通牒》,而參與人2想看《特務風雲:中情局誕生秘辛》。我覺得妮娜的策略很好,妮娜的回答很乾脆-我會去看《神鬼認證:最後通牒》,就解決問題了。
 
不過也可能有溝通失敗的情況,必須有一個參與人做出讓步。我不想把問題說得太嚴重,我們不妨舉一些溝通失敗的賽局案例,或者說努力避免溝通失敗。就在此時,有一場罷工談判正在進行中,就在今天早上的底特律,通用汽車和工會的局勢變得十分緊張,我不敢斷定這次罷工就是因為缺少溝通,但很顯然地,如果能達成協定不去罷工,對每個人來說都更好一些。簽訂協議至少比大家都去罷工要好一些吧!但話說回來,他們也的確存在利益衝突,籠統地講是有關健康問題和退休金的利益問題,這很容易會導致協調失敗。
 
像這樣的賽局有個術語,上一講也有人提到過,誰說到過呢?我記得有人說起過,這個賽局學名叫什麼?大聲說出來,它叫性別大戰。沒錯,就叫性別大戰,我們會在這學期的課程中陸續接觸到的。它實際上是個非常有趣的賽局,這樣的賽局屬於協調賽局,但不同參與人偏好不同的結果。
 
講了有關協調賽局和約會策略的問題,今天我們就講這麼多了吧!既然這門課叫賽局理論,我們就得學習一下接下來要講的模型。我準備用餘下的時間來講講庫諾的雙占模型,在講它之前,我先問問你們,你們有多少人學過庫諾雙占模型?請舉手。很好,差不多一半的人學過。如果你沒學過也不必擔心,我們一起來快速回顧一下吧!但這次我們用賽局理論的角度去分析,那些之前沒有學過的同學別擔心,現在我們一起來看一遍。
 
這是一個經典的賽局案例,可能是最著名的賽局案例之一,很值得在我們課堂上研究一下。現在把它單純看成一個賽局理論練習,學習庫諾雙占模型的一個原因是,我們已學過怎樣在參與人較少,且策略不多的賽局中找出納許均衡,我們也討論過如何找出有很多參與人,但每個參與人策略不多的賽局的納許均衡。但這個賽局的參與人不多,只有兩個,但他們卻有很多可選策略。實際上,他們的策略是連續的。那些沒有涉足過這些知識的同學,或者經濟學學得不太好的同學,回去看看教材第六章,有詳細解釋的,所以各位不必擔心學不會了。
 
這個賽局之所以有趣,有兩個原因。它講的是在同一個市場中,只有兩家公司互相競爭,稍後我會給出更多的細節。從經濟學角度看,這之所以有趣,是因為這個賽局介於經濟學導論的兩種極端情況之間。一個極端情況是完全競爭,另一個則是壟斷,因此這就是它第一個誘人之處。我們要回到十九世紀,去研究一個介於兩者之間的市場。那個年代大多數市場都只有兩家公司。
 
我們只需要研究兩樣東西。我們需要研究這樣的市場會如何發展,其次,從政治上的福利觀點來看,我們還需要研究這對消費者有利,還是對生產者有利,這與消費者剩餘有什麼關聯。我們帶著這些問題,建立這個賽局的模型。
 
這個賽局的參與人是兩家公司,他們的可選策略如下,以後你會知道這是多麼重要。策略是某種同質商品的產量。也就是說,每家公司的商品產量,因為他們生產的是同質的商品。對於消費者而言,這兩種商品是完全替代品。把他們想像成兩家瓶裝水廠商吧!我估計我們會收到數百封信件,告訴我說,不是所有瓶裝水都是一樣的,尤其是從義大利和法國寄過來的那些。無所謂了,就把它們想像成是同質的吧!為了突出策略就是商品的產量,這次我們用Q來表示策略,而不用S了。用qi,q-i,q1,q2表示策略。
 
在告訴大家收益之前,還需要知道一些別的東西。譬如說,大家要知道生產成本怎麼計算。在這個賽局裡,生產成本就是c*q,生產1單位的產品成本是c;如果生產2單位成本就是2c,如果我生產100單位,成本就是100c,如果生產0.735單位,就是0.735c。大多數學過經濟學導論的同學都知道,這裡的邊際成本是一個常數,邊際成本就是常數c。
 
接下來我們還得知道如何制定市場價格,價格由如下因素決定。價格取決於兩個參數a和b,我們用方程式寫一下吧!中心思想就是,兩家企業生產得越多,即產量q1 + q2越大,該產品的市場價格就越低。我先畫出圖像,一會兒再細說,這個圖像我們以後還會講到,我把這塊黑板拉下來吧!根據剛才的方程式,q1 + q2,我們用橫座標表示總產量,縱座標表示市場價格,之前我們是怎麼說的來著?產品的價格由以下因素決定。這條圖線的斜率是-b。
 
我來問一下學過經濟學115的同學,這條曲線叫什麼名字?沒幾個人回答啊!我再問一遍,這條向下傾斜的曲線叫什麼?它叫需求曲線。感謝你的回答。它直觀的顯示出價格如何與產量對應,即在給定的價格上,需求量是多少。我們一會再繼續討論這一點,我們先把收益寫出來吧!
 
每家公司的收益跟利潤有關,這些公司的目標是利潤最大化,利潤這樣計算:p*q-,抱歉,我們先寫公司1的吧!這裡要稍微注意一下,我們先寫公司1的,然後再寫公司2的。公司1的收益取決於她的產量以及另一家公司的產量,即公司1的收益是價格乘以她的產量,再減去成本乘以她的產量,也就是說,用收入減去總成本,收入減去成本就是利潤。對經濟學不太瞭解的同學,我覺得這個很簡單,你們都能聽懂吧?
 
接下來我要用運算式來替換價格。我們之前已經給出了價格的運算式,用它來代換這裡的P,我把它代入到這個運算式,然後展開,透過整理我們就可以得到aq1 - bq1² - bq1q2 - cq1,這些計算過程確實很枯燥,我只是把這個算式代入到P中,然後打開整理,因為每一項都乘以了q。我還得提醒一下大家,我總是算錯,如果發現錯誤請馬上指出。這就是公司1的利潤運算式。接下來我們算公司2的,我就不算了,太沒有意思了。
 
現在我們只知道公司1的利潤,知道它了以後,因為公司2的運算式也是相似的,接下來我們就可以嘗試找出納許均衡了。我再找一塊黑板來寫板書,下面我們尋找這個賽局的納許均衡。兩個公司都生產商品,都希望最大化利潤,而我也想找出納許均衡,如何找出納許均衡呢?我們怎樣才能找出每家公司的納許均衡呢?不猜測的話,我們怎麼分析納許均衡呢?有誰想回答這個問題嗎?那位同學舉手了,但是錄影機拍不到。沒事,遞給他一個麥克風吧!他坐在那個角落裡,靠近過道那邊。對了,就是他。
 
學生:我覺得我們可以迭代剔除劣勢策略
 
教授:是的,可以這麼做,可以嘗試迭代剔除劣勢策略,然後看看會不會趨向於某種結果。但是我還有別的方法,更直接的方法。穿紅衣服的同學,你來說說看。
 
學生:把每個參與人的最佳對策看成是其他參與人策略的一個函數,然後找出兩個函數的交點。
 
教授:你說對了,大點聲重複一遍。
 
學生:把每個人的最佳對策看成別人策略的函數,然後找出函數的交點。
 
教授:很好,下面我們就需要表示出,參與人1對於2不同產量下的最佳產量,然後反過來寫出,在參與人1的不同產量下,參與人2的最佳產量,然後再來看看這兩者在哪裡相交,就像我們之前做的一樣。所以我們要先找出在參與人2的每個可選策略q2下,參與人1的最佳產量。我該怎麼找出最佳產量呢?看大家的樣子我就知道你們都會算,有沒有人想回答一下?動動腦筋,坐在後面的同學,站起來大聲回答。
 
學生:求導得出q2,取最大值的情況下,參與人1最佳對策是q2的一個函數。
 
教授:說得很好,接下來我們要求出最大值。最佳對策就是最大化利潤,所以我們要算出來在不同的q2下,q1取什麼值才能最大化利潤。對q1求導之後還要做什麼?還要令導數等於0。我再問一下,多少人還記得這些知識?我們在前幾講裡用到過這些知識,多少人還記得高中微積分的知識?或者還記得112的課程內容的?記得的人還真不少啊,好吧,那我們接下來對它求導後,找出一階條件,對q1求導,q1是控制變數,也就是我們想要求出的最大值,令它等於0。
 
我們會得到什麼呢?aq1項就變成了a,-bq1²項就變成了2bq1,而-bq1q項2變成了-bq2,最後一項-cq1變成了-c,大家都會是吧?只不過是對q1求導罷了。既然我們要求出最大值,只需要令導數等於0就可以了。給每個最大值都標注上一個帽來,在最大值處導數方程式等於0。現在的內容的確有點枯燥,儘管我們有對約會的美好追求,但我們還是嚴謹一點好啊。這個只是一階條件,是必要條件,實際上我們還需要驗證二階條件。怎樣驗證二階條件呢?需要再次求導,是吧?我們對它進行二次求導,然後看符號。這個式子的二階導數就是一階導數再對q1進行求導,只有這一處有q1,因此二階導數是-2b,它肯定是個負數了,這正是我們想得到的結果。這就驗證了,我們剛才得出的是最大值,而不是最小值。
 
好了,這是個關鍵運算式,我們一會還要用到它的。我們用它來解出q1,這個就是參與人1的最佳對策,它是參與人2策略q2的一個函數,它和之前的q1帽那個運算式是相等的。雖然我是很仔細地計算的,還是有可能算錯的,我來驗證一下,應該是(a-c)/2b - (2b-q2)/2,你們回家再算算,我感覺沒算錯。透過移項和通分成2b,就可以消去b了,大家再看一看我算得對不對,我總是容易算錯。這個方程式表示,參與人2不同策略下,參與人1的最佳對策。同理,對於參與人2來說,可以算出參與人1不同策略的最佳對策。
 
計算方法是類似的,我們就偷懶不算了。參與人1不同策略下,參與人2的最佳對策,即q2帽等於(a-c)/2b - q1/2,我只需要把參與人2和1的運算式調換,就能得出參與人1最佳對策是q2的函數,以及參與人2的最佳對策是q1的函數,而且我們用到的數學知識只是稍微與112和高中微積分有關,僅僅是單變數微積分的知識。目前為止我們可以求解了,但先等一下,我先把圖像畫出來。
 
下面我們一起來作出這些函數的圖像。再說一遍,參與人2的方程式是 (a-c)/2b - q2/2,這個運算式被黑板擋住了,下面我來畫出函數圖像。這與合夥人賽局有點像,合夥人賽局中,橫軸表示付出的努力,現在橫軸表示的是產量,這個表示參與人1的策略,這個表示參與人2的策略。接下來我想要知道,這個函數究竟是什麼樣子的?對與參與人2的每個策略q2,我想知道參與人1的最佳對策是什麼?目前為止大家都能聽懂吧?
 
就從這裡開始著手吧!我們先來參考一下之前的圖像,所以我之前沒有擦掉它。比如說,參與人2產量為0時,1的最佳對策是什麼,這個怎麼求解呢?不需要考慮經濟學的理論,用數學的方法怎麼來求解啊?假如參與人2產量為0,誰來說一下,參與人1最佳對策是什麼?我隨便找一個吧,就你回答吧!
 
學生:是 (a-c)/2b
 
教授:沒錯,大點聲說。
 
學生:是 (a-c)/2b
 
教授:把q2=0代入到算式中,這部分就沒有了,只剩(a-c)/2b。這說明什麼?我把45°輔助線畫出來。參與人2產量為0,而參與人1最佳對策是(a-c)/2b。這能說明什麼?(a-c)/2b這個值是個術語,這個值的術語叫什麼呢?這個(a-c)/2b叫什麼?不是數學的術語,是經濟學的術語。好好想想,再看看前一張圖。
 
參與人2產量為0,參與人1會怎樣呢?她會形成壟斷。我們都知道如何計算壟斷產出,在115或者類似課程中都學過的。先把圖畫完。這條是需求曲線,這個是邊際成本常量c,下面我們透過左邊的圖像,來找出壟斷產量,誰來說?我再隨便找一個人吧!學過115,110,150的請舉手,不是吧?肯定不止這些,這些可都是賽局理論的先修課啊!那沒學過的請舉下手,先別放下手。艾爾,你去找一個沒有舉手的人回答,誰來回答一下?你來說一下,圖中哪一點表示壟斷產量呢?就是你旁邊的女同學。
 
學生:抱歉,我忘記了
 
教授:你忘記了,好吧,還有誰也忘記了啊?如果你是司法部長的話,我忘了是一個很不錯的藉口,可惜這裡不是這樣的。誰來回答?誰來說一下啊?圖像中的哪一點是壟斷產量啊?這可真是個不錯的復習題。
 
學生:是邊際收入等於邊際成本的那點
 
教授:是邊際收益等於邊際成本的那點,我真應該找一個管理學院的人來回答。是邊際收入等於邊際成本那點,對吧?我為什麼要找管理學院的人回答呢?因為他們人生最大追求就是要搞壟斷,但問題是,我們現在沒有邊際收入曲線啊!實際上你們不知道邊際收入是多少,這個圖像中的邊際收入是什麼呢?請穿棕色衣服的同學來回答吧!邊際收益是什麼樣子的?左圖中的邊際收益圖像是什麼樣的?
 
學生:它等於價格曲線斜率的一半
 
教授:我覺得是斜率的2倍,我明白你的意思。我用另一種顏色表示邊際收入。邊際收入的圖像是這樣的。我不知道那位同學的名字,他說壟斷產量是邊際收入等於邊際成本的產量,我們都知道了,這條線的斜率是需求曲線斜率的2倍,也就是說它的斜率是-2b。
 
好了,我得說明一下,我之前說的壟斷產量直覺告訴我們,如果另一家公司不生產,我們的最佳對策是壟斷產量,這圖像中就能看出來的,透過數學計算也是一樣的,雖然我一直認為數學很枯燥乏味。壟斷產量是(a-c)/2b,兩種演算法都一樣。為什麼說兩種演算法結果一樣呢?看一下這裡,這條線斜率是-2b,它最低能到哪裡呢?最小是a-c,這條粉色的線要經過縱座標a-c,斜率-2b的線還要經過哪個橫座標呢?答案是(a-c)/2b,絲毫不需要微積分,高中數學知識足矣。
 
因此壟斷產量是(a-c)/2b。再問一下,大家都明白了嗎?我是說可能代數部分你沒看懂,但你們以前見過類似的圖像吧?對於學過115或者想要學習150的同學,這是一個不錯的復習案例。現在我們只找到了最佳對策曲線上的一點,我們還需要找到更多的點。現在12點20了,我們得快點了。我們試著再找一個點,我們再想另外一個問題。公司2的產量達到多少時,公司1會選擇停產呢?重複一遍,公司2的產量是多少時,公司1的最佳對策是產量為0呢?你叫凱特吧?你來回答吧!把麥克風遞給凱特,穿綠上衣的女士,她旁邊就有一個麥克風。
 
學生:產量是(a-c)/2b
 
教授:沒錯,只需要解出當 (a-c)/2b-q2/2=0 時q2的值即可。q2為何值時,這個算式等於0呢?凱特的回答其實就是算出這個的解,即q2=(a-c)/b。好了,那這一點在圖上怎麼表示呢?再回顧一下經濟學的知識,這裡要用到以前學過的一個量,這個量是 (a-b)/b。如果公司2生產這麼多,公司1就會停產,但這只是數學問題,在圖上怎麼表示這一點呢?公司2的產量是多少的情況下,公司1才能被迫停產呢?遞給他一個麥克風。
 
學生:應該是在邊際成本與需求曲線的交點上
 
教授:沒錯,就是這點,邊際成本與需求曲線的交點處。從中能夠得出什麼呢?我們來看一下。假設公司2產量一直提高到這裡,即公司2生產了全部這麼多的單位,這樣公司2的產量會導致價格下降直到成本價格。如果我是公司1,我要是再生產,價格會怎麼變動呢?如果我再額外生產一些產品,會對產品價格產生什麼影響?產品價格會被壓到成本以下,這就導致成本是c的瓶裝水只能賣到p,這個價格都不能撈回本錢呢!所以我生產的每件產品都會虧本,大家都明白了嗎?
 
再重複一遍,如果公司2的產量一直增加到這裡,那麼公司1的每一件產品必須降價出售,這種情況下,價格會低於成本,你越生產越賠錢。在經濟學115的課程裡面,這個量的學名叫什麼呢?需求曲線和邊際成本的交點叫什麼?是完全競爭產出,這個就是完全競爭產出。在完全競爭市場中,這就是最終的市場價格。這個案例的情況不是完全競爭市場,但是如果是,這個就是最終的價格。
 
這樣我們就算出了壟斷產出,還有完全競爭產出。二者之間的圖線是什麼樣的呢?誰知道?是條直線。謝謝你的回答,兩點之間就是一條直線。這是公司2每種策略下,公司1的最佳對策。看大家的表情好像是非常難的樣子,其實沒那麼難。你們大多數人都學過吧?如果沒學過也沒什麼,我只不過是稍微用了點微積分,做了點代數運算,然後就畫出來了。公司1的最佳對策是q2的函數,q1的函數即公司2的最佳對策,是什麼我們當然也能算出來。提醒一下各位,這個圖像的意思是,任意給出公司2產量,然後透過這條粉色的線,就可找出與之對應的公司1的最佳對策。如果公司2的產量是這麼多,那麼公司1的最佳對策就是這個產量;如果公司2的產量是這麼多,那麼公司1的最佳對策就是這個產量。反過來,如何由q1求公司2最佳對策的方程式?方程式會是什麼樣的呢?你前面的那兩位同學,大聲點。
 
學生:它關於45°線對稱
 
教授:很好,它關於45°線對稱,那我們就把這兩個點對稱過去,一個點在這裡,這個點呢?我有點沒畫好,差太多了,重新畫吧!我畫得偏差太大了,應該是線的問題,但這無所謂了。這裡表示公司2的壟斷產出,這裡是公司1的完全競爭產出,如果我畫得準確的話,這段應該是整段長度的一半,不過我沒畫好,你們在筆記本上好好畫一下吧!這點是(a-c)/b,這點是 (a-c)/2b,這兩段長度應該是相等的,我畫的一看就不相等。這條綠色的線表示,任意給出公司1的產量q1,根據這條綠線的對應法則,就可以對應出公司2的最佳對策。目前為止,有多少人見過這個圖像?看來有不少人以前見過啊!我那隨便找個人來問個問題吧,我隨便找個人來問問吧!隨便找一個坐在邊上的人就行,就你了。我問個有難度的問題。這個圖像的納許均衡在哪裡?
 
學生:在綠色與粉色線的交點處
 
教授:沒錯,就是綠線和粉線的交點,這點就是納許均衡了,這不難,是吧!好吧,那我再來問一下,為什麼說這點就是納許均衡呢?因為這一點與合夥人賽局的情況一樣,兩者的情況是很類似的。合夥人賽局中最佳對策曲線的交點處,參與人1採用了回應參與人2的最佳對策,參與人2採用了回應參與人1的最佳對策,因此這點就是庫諾賽局的納許均衡了。
 
我們不妨也佐以數學計算驗證一下。我們只需要令這兩個運算式相等,在這裡標注上*號,想要求出納許均衡,就要令q1*=(a-c)/2b-q2*/2以及 q2*=(a-c)/2b-q1*/2,代入q1=q2來解出這個方程,這是因為這個賽局是對稱的,而且是關於45°線對稱。因此,我只要透過代數運算,就能解出這個等式。咱們來試一下。把q1寫在這,如果替換掉q1會得到什麼?會得到q1*=(a-c)/2b-q1*/2,等式兩邊同時乘以2,得到 2q1*=(a-c)/b-q1,把q1*移項後,可以得到3q1*= (a-c)/b,最後兩邊同除以3,得 q1*=(a-c)/3b,因此交點確實是(a-c)/3b。我得問問助教們,檢查一下我是否算錯了?這被稱作庫諾產出。
 
這個賽局,這個關於兩家公司產量競爭的賽局,早在納許出生一百多年前,就被一個法國的經濟學家庫諾研究過。一百多年前,賽局理論還沒有誕生呢!那時就有人解出了這個賽局的答案。我們總結一下所學到的知識吧!先把算式留在那好了,我在這裡再抄一遍吧。q1*=q2*=(a-c)/3b,到目前為止我們的計算真的很繁瑣,但是我覺得我們沒學到什麼東西呢,我們只是解出了一道題罷了。下面我們從中總結點經驗出來,那些因為代數和微積分計算,還有繪圖而感到十分不爽的同學,你們是不是感覺被我拐了,才會選這門一點都不像經濟學的課啊?稍安勿躁,我們馬上切入正題。
 
這個賽局中最明顯的一點,也是直接能觀察出來的,是這個賽局和其他賽局有很大不同。它與合夥人賽局就不一樣,很顯然二者的研究物件不同,但我是說二者涉及的賽局理論也不同。它與合夥人賽局不同,與投資賽局也不同,這個賽局的不同之處在於-從這個圖上能很明顯看到的,它確實與合夥人賽局有所區別。合夥人賽局的最佳對策曲線是向上傾斜的,我如果採用付出更多努力的策略,其他參與人的最佳對策也是這樣。在投資賽局中,我投資的機率越大,你們也就越想要投資。
 
但這個賽局恰恰相反。參與人1的產量越多,參與人2就會減產;如果參與人2增產,那麼參與人1就要減少產量。這不是一個策略互補賽局,而是策略替代賽局,這一點大家要注意啊!並不是說這些商品是替代品,它們確實能成為替代品,是吧?如果兩家公司生產同質的瓶裝水,那麼它們的產品是可以互相替代的。但重點不在這裡,策略替代是一種策略,這是對於賽局性質的一種描述。策略替代就是說,我的策略是你的策略的一種替代策略,我的策略實施越多,你的策略就會實施越少。反之,你的策略實施越多,我的策略就越少。
 
現在我們來回答剛剛講課時提到的問題,是與社會現實中的利潤有關的問題。我們知道,如果這些參與人進行賽局,至少我覺得在納許均衡條件下,他們會安排這樣的產量。那我再問大家一個問題。每一家公司都盡力實現利潤最大化,可整個行業總利潤是怎樣計算的呢?每家公司都會採取最佳策略,來根據對手的行為達到最大化利潤。但是此情況下,行業利潤是否最大化呢?誰覺得行業利潤也最大化了?誰認為行業利潤沒有最大化?很好,大聲說出來。行業利潤並沒有最大化。我隨便找個同學來回答一下。在圖上哪一點實現了行業最大利潤,叫過他了啊?要不你再回答一遍,找他來回答吧!
 
學生:應該是在壟斷的情況下吧!
 
教授:壟斷情況,完全正確。顯然,根據定義,壟斷產量使行業總利潤達到最大化。比如公司2停產,而公司1生產壟斷產量,壟斷產量會使行業利潤最大化。反之,公司1停產,而公司2生產壟斷產量,這樣也能最大化行業利潤。還有哪點能實現行業利潤最大化呢?誰來回答?這點會使行業利潤最大化,這個點也會,還有沒有其他點?誰來回答下?
 
兩點之間還存在滿足條件的點嗎?在這點是公司1停產,公司2壟斷,而在這點是公司2停產,公司1壟斷。但也可以把壟斷產量分開呀!比如一家生產一半。所以如果你們想多賺錢,唯一能做的就是簽協議。我們不要按庫諾產量生產了,各自生產壟斷利潤的一半多好呢?我說錯了,是壟斷產量的一半。這樣雙方都按照這樣的協議生產,即公司1生產壟斷產量一半的商品,公司2也生產壟斷產量一半的商品,這種協議有什麼問題呢?有兩家瓶裝水公司,比如說波蘭泉和可口可樂,他們簽署了協議規定,每家都只生產壟斷產量的一半,這個協議有什麼問題嗎?穿紅衣服的那個男生來回答。
 
學生:首先這是違法的
 
教授:它是違法的,就算是司法部長不知情,司法部門也會有人會發現。這樣的協議是違法的,簽訂這樣限制產量的協議屬於違法行為。因為是違法的,合同也就無效了。不過他們可以私下達成默契,假如可口可樂和波蘭泉達成默契了,同意各產壟斷產量的一半,那這樣的默契存在什麼問題呢?假設我們正在進行這個賽局,假設這是可口可樂的產量,這是波蘭泉的產量,你是波蘭泉的經理,緬因州的地下水都是你的,你也知道可口可樂的產量是這些,數量是qM/2。我找兩個同學當經理,找兩個發過言的人吧,穿紅襯衫的男生叫?
 
學生:斯蒂文
 
教授:斯蒂文是可口可樂的經理,再請出上周的詹姆斯•史都華,叫派翠克的那位同學來,請給派翠克一個麥克風。史蒂夫和派翠克分別是可口可樂和波蘭泉的經理,派翠克認為可口可樂的經理打算-或許該用可口可樂和百事可樂,他們倆才是對手,是吧!那就可口可樂和百事可樂吧,這會更容易理解。百事的經理派翠克認為,可口可樂會按照協議產量來生產,他也會這麼做,那實際上派翠克怎麼做的?派翠克你準備怎麼辦?
 
學生:我會違約選擇我最佳對策的產量,我會生產出遠遠多於協約量的產品來。
 
教授:好的,派翠克是百事可樂公司的經理,他會生產更多這種難喝的飲料,產量是這麼多,這點表示什麼呢?表示派翠克在面對其他人按照壟斷產量生產時的最佳對策。百事可樂公司面對壟斷產量採取的舉措是增加產量,實際上增加產量就會導致產量逐漸接近庫諾產量。派翠克是這麼制定產量的,那可口可樂會怎麼做呢?可口可樂的人很瞭解派翠克,他們做同行有段時間了。可口可樂的經理叫什麼來著?
 
學生:史蒂文
 
教授:史蒂文。史蒂文很可能知道,派翠克的實際產量是這麼多,抱歉,是這麼多,那你會如何制定產量?
 
學生:我會根據最佳對策曲線來增加產量
 
教授:很好,史蒂文預料到到派翠克認為自己是個傻瓜,然後派翠克會違約增產,那麼史蒂文的最佳對策就是生產這個數量的產品,這是什麼?這是參與人2的最佳對策,即參與人1對於2半壟斷產量的最佳對策。但是派翠克也很瞭解史蒂文,他知道可口可樂的經理都很精明,派翠克知道可口可樂的經理會預料到,派翠克會違約,因此可口可樂的經理就會尋找最佳對策。因為派翠克違約在先,那麼派翠克會生產多少呢?
 
學生:我會增加產量,會非常接近庫諾均衡產量。
 
教授:好的,你準備生產這麼多,這點在這裡,都寫不下了。它表示參與人1對於參與人2的最佳對策,是參與人2生產壟斷產量一半的情況下的。這裡有一大堆的括弧,有誰知道最後會怎樣呢?它會達到納許均衡,每家公司都想採取預料的對方策略的最佳對策來制定產量,這個賽局-如果他們一直這樣做,最終會達到納許均衡的狀態。但請注意,並非所有賽局都會這樣,但在這個賽局中,互相採取最佳對策,預料到了對方會違約,或者對方預料到了我會違約,或者對方知道我會預料到他會違約-以此類推,那麼最終還是會達成庫諾產量的。
 
因此說,想要透過私下協議來維持壟斷產量是非常困難的。我們都缺乏強制力,我們是可口可樂和百事可樂公司,我們都不想將黑手黨捲進來。可能也希望他們介入吧,誰知道呢?但不管怎樣,在這個口頭協議不起作用,我們都有違約生產更多這種糖水的動機。
 
實際上,這並非兩個想維持壟斷產量的企業需要面對的唯一問題。現實中,公司想要達成這樣的協議,而非合同,想要維持壟斷產量還會遇到什麼問題呢?你想一下,企業想要達成協定,我們都知道不能簽署違法合同,那就只能私底下簽協定了。比如1900年,甚至更早的美國,假如是1880年的美國吧,在當時這種限制產量的合同是否違法?在司法上沒有明確的界定,當時的企業紛紛簽訂了這樣的協定,但仍然有問題出現。究竟是哪出了問題?我們有點扯遠了,回到正題上來吧。到底是哪裡出現了問題?找個離話筒比較近的來回答下,那個穿耶魯校衫的女生你來回答吧。
 
學生:不是合同就缺乏強制力
 
教授:好的,但是我剛才說了強制性的問題,雖然說那是1880年的美國,當時這種合同是否違法沒有明確的界定,強制性是一個問題,但那也是在很久以前的問題。還有什麼?她旁邊的同學。
 
學生:如果他們不按照完全競爭產量生產,就可以透過降低價格來搶佔市場。
 
教授:請大家注意,我們以後才會講到這一點的,現在只考慮產量的競爭,我們壓根兒都沒有提價格的事兒。我們只是生產可口可樂和百事可樂,只是投入市場造福百姓而已,誰還有別的想法呢?我來說吧,問題出在這裡了。假設可口可樂和百事達成了協議,不管簽的是協定還是合同,只要能透過協約維持壟斷產出,透過制定高價來達到正的利潤就行。這樣價格是高於成本的,兩家公司都有利可圖,那這個行業接下來會發生什麼?現在這是一個有利可圖的行業,接下來會發生什麼呢?艾爾,把話筒給穿藍襯衫的小夥子。
 
學生:別的競爭者會加入市場。
 
教授:別的公司會加入並生產同質產品,比如佩珀博士或者其他公司。其他公司會參與進來也生產可樂,這就是上個世紀末在美國發生的事情。公司之間簽署了限制產量的協議,比如說有造紙業、橡膠製造業、煉鋼業、冶鐵業、鐵路運輸行業,當然還有更複雜的行業,不久你就會發現有大量的新興公司進入了這個領域。他們發現先入行公司在限制產量,就也進入行業來賺錢了。大批新公司的進入,引入了競爭機制,壓低了市場價格。剛才我說的就是,在二十世紀美國的哪些行業發生了巨大的變革,我們知道美國全盛時期有這樣的先例。還有什麼行業原來也有產量協議,但新公司進入後卻導致協議瓦解呢?
 
學生:航空業
 
教授:很好,航空業是一個很典型的案例。別的呢?石油產業也是個典型案例吧!航空業也是個不錯的案例。眾所周知,在上世紀六七十年代,為了限制石油的產量,主要產油國成立了OPEC組織,但是很快就有一些國家利用這點來產油獲利,誰是與OPEC競爭的新興勢力呢?是英國、不列顛、英格蘭和蘇格蘭。英國首先在北海開採石油,後來很多拉美國家也開始開採石油了。當然俄羅斯採油收入也是頗豐的。
 
這樣的私下協議難以維繫是有多方面原因的,一方面大家都有違約的動機,另一方面會有新人加入。下課前我們解決一下上課時提的問題。假如我們處在庫諾產量的情況下,現在我們處在庫諾產量下,第一,該產量下的價格產出和壟斷價格產出相比有何不同?和完全競爭價格又有什麼不同呢?我們能夠算出來產量是多少,我們能夠算出來的。我們知道產量是多少,每家公司的產量是(a-c)/3b。而且市場中有兩家公司,這樣整個行業的總產出就是2(a-c)/3b。
 
這與壟斷產量相比有何不同呢?壟斷產量是(a-c)/2b,完全競爭產量是(a-c)/b。提示大家一下,這幾點都在圖上呢。這裡是(a-c)/2b,這裡是(a-c)/b,這就是在庫諾賽局中的納許均衡。它和壟斷產量以及完全競爭產量相比,有何不同?誰來回答?參照著黑板說,哪個值更大?我說吧,這種情況下的總產出比完全競爭產量要少,但比壟斷產量要大,我是不是把你們弄糊塗了?此情況下的總產出比完全競爭情況下的要少,但比壟斷情況下的要大。相應的,價格則呈相反趨勢。壟斷情況下的價格最高,完全競爭情況下的價格最低,庫諾均衡時價格處於兩者之間。
 
從生產者的角度來看,庫諾均衡劣於壟斷,優於完全競爭;而從消費者的角度來看,庫諾均衡劣於完全競爭,但優於壟斷情況。如果可口可樂是唯一的生產者,並且你很關心牙齒健康的話,或許你就不應該生產這麼多產品了。到現在為止,我們只學了經典案例,我承認這不是什麼有趣的賽局,只是賽局理論在不完全競爭市場的應用。下一講我們講得會更深入一些,但下一講我們不講這個案例了,我們用其他賽局方法研究不完全競爭。
 

以下為系統擷取之英文原文

Game Theory with Professor Ben Polak

course images
About the Course

This course is an introduction to game theory and strategic thinking. Ideas such as dominance, backward induction, Nash equilibrium, evolutionary stability, commitment, credibility, asymmetric information, adverse selection, and signaling are discussed and applied to games played in class and to examples drawn from economics, politics, the movies, and elsewhere. view class sessions >>



Course Structure:

This Yale College course, taught on campus twice per week for 75 minutes, was recorded for Open Yale Courses in Fall 2007.

About Professor Ben Polak


Ben Polak is a Professor of Economics and Management in the Department of Economics and the School of Management at Yale University. He received his B.A. from Trinity College, Cambridge University, his M.A. from Northwestern University, and his Ph.D. from Harvard University. A specialist in microeconomic theory and economic history, he has published in Economic Letters, Journal of Economic Theory, Journal of Economic History, Journal of Legal Studies, Journal of Theoretical and Institutional Economics, and Econometrica. His current projects include "Generalized Utilitarianism and Harsanyi'sImpartial Observer Theorem" and "Mean-Dispersion Preferences."



ECON 159: Game Theory (Fall, 2007)

Syllabus

Professor:

Ben Polak, Professor of Economics and Management, Yale University



Description:

This course is an introduction to game theory and strategic thinking. Ideas such as dominance, backward induction, Nash equilibrium, evolutionary stability, commitment, credibility, asymmetric information, adverse selection, and signaling are discussed and applied to games played in class and to examples drawn from economics, politics, the movies, and elsewhere.



Texts:

A. Dixit and B. Nalebuff. Thinking Strategically, Norton 1991

J. Watson. Strategy: An Introduction to Game Theory, Norton 2002

P.K. Dutta. Strategies and Games: Theory And Practice, MIT 1999



Requirements:

Who should take this course?
This course is an introduction to game theory. Introductory microeconomics (115 or equivalent) is required. Intermediate micro (150/2) is not required, but it is recommended. We will use calculus (mostly one variable) in this course. We will also refer to ideas like probability and expectation. Some may prefer to take the course next academic year once they have more background. Students who have already taken Econ 156b should not enroll in this class.

Course Aims and Methods.
Game theory is a way of thinking about strategic situations. One aim of the course is to teach you some strategic considerations to take into account making your choices. A second aim is to predict how other people or organizations behave when they are in strategic settings. We will see that these aims are closely related. We will learn new concepts, methods and terminology. A third aim is to apply these tools to settings from economics and from elsewhere. The course will emphasize examples. We will also play several games in class.

Outline and Reading.
Most of the reading for this course comes from the first ten chapters of Dutta or from the first two parts of Watson. There will be a reading packet for weeks 6-7. The readings are not compulsory, but they will help back up the class material.



Grading:

Problem sets: 30%
Midterm examination: 30%
Final examination: 40%



ECON 159: Game Theory

Class Sessions

Click session titles below to access audio, video, and course materials.

1. Introduction: five first lessons
2. Putting yourselves into other people's shoes
3. Iterative deletion and the median-voter theorem
4. Best responses in soccer and business partnerships
5. Nash equilibrium: bad fashion and bank runs
6. Nash equilibrium: dating and Cournot
7. Nash equilibrium: shopping, standing and voting on a line
8. Nash equilibrium: location, segregation and randomization
9. Mixed strategies in theory and tennis
10. Mixed strategies in baseball, dating and paying your taxes
11. Evolutionary stability: cooperation, mutation, and equilibrium
12. Evolutionary stability: social convention, aggression, and cycles
Midterm Exam
13. Sequential games: moral hazard, incentives, and hungry lions
14. Backward induction: commitment, spies, and first-mover advantages
15. Backward induction: chess, strategies, and credible threats
16. Backward induction: reputation and duels
17. Backward induction: ultimatums and bargaining
18. Imperfect information: information sets and sub-game perfection
19. Subgame perfect equilibrium: matchmaking and strategic investments
20. Subgame perfect equilibrium: wars of attrition
21. Repeated games: cooperation vs. the end game
22. Repeated games: cheating, punishment, and outsourcing
23. Asymmetric information: silence, signaling and suffering education
24. Asymmetric information: auctions and the winner's curse
Final Exam


ECON 159: Game Theory (Fall,2007)

Downloads

Course Pages:

The file below contains all of the course pages from this course andmay be downloaded for offline use. The file is offered in .zip format;you must have access to a suitable decompression application to unzipthe contents before use. After decompressing the file, please click"start.html" to launch.

[ download all course pages ] - size 9.2 MB - filetype application/zip



Course Media:

Audio and video files for this course may be downloaded in two ways: iTunes U or the links below for individual files.

To download all tracks from iTunes U, click the "Get Tracks" button on any course page in the iTunes U interface. If the download is interrupted, click "Resume" to continue the download process. You must have Apple's iTunes software installed on your computer to download from iTunes U.

 

To download individual media files from the course, please click the links in the Class Sessions section below. Apple QuickTime 7.2 or higher is required to view the videos, while the mp3 files will play in any mp3-compatible device/player.

 
 1. Introduction: five first lessons[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 2. Putting yourselves into other people's shoes[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 3. Iterative deletion and the median-voter... [ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 4. Best responses in soccer and business...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 5. Nash equilibrium: bad fashion and bank runs[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 6. Nash equilibrium: dating and Cournot[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 7. Nash equilibrium: shopping, standing...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 8. Nash equilibrium: location, segregation...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 9. Mixed strategies in theory and tennis[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 10. Mixed strategies in baseball, dating...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 11. Evolutionary stability: cooperation, mutation...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 12. Evolutionary stability: social convention...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 13. Sequential games: moral hazard, incentives...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 14. Backward induction: commitment, spies...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 15. Backward induction: chess, strategies...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 16. Backward induction: reputation and duels[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 17. Backward induction: ultimatums...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 18. Imperfect information: information sets...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 19. Subgame perfect equilibrium: matchmaking...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 20. Subgame perfect equilibrium: wars of attrition[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 21. Repeated games: cooperation vs. the end...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 22. Repeated games: cheating, punishment...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 23. Asymmetric information: silence, signaling...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]
 24. Asymmetric information: auctions...[ high bandwidth ]   [ medium bandwidth ][ mp3 ]

留下您對本課程的評論
標題:
您目前為非會員,留言名稱將顯示「匿名非會員」
只能進行20字留言

留言內容:

驗證碼請輸入1 + 4 =

標籤

現有標籤:1
新增標籤:


有關本課程的討論

課程討論
有講座7以後的翻譯課程嗎

Anonymous, 2017-02-14 14:52:23
課程討論
好課
Anonymous, 2016-10-29 16:36:32
課程討論
http://oyc.yale.edu/economics/econ-159
Anonymous, 2015-01-02 12:49:15
課程討論
這門課沒有繼續翻好可惜
Anonymous, 2014-06-26 01:57:23
課程討論
video link to yale 內容也被移除
Anonymous, 2014-03-08 19:12:52
課程討論
原始Class Sessions video無法下載
Anonymous, 2014-03-08 19:12:01
課程討論
講義不能下載QQQ
Anonymous, 2013-11-19 19:13:43
課程討論
講義和筆記部分的PDF無法下載
Anonymous, 2012-08-27 16:40:12
課程討論
希望接下來仍能持續翻譯!
tommyccc, 2012-05-29 08:21:08
課程討論
講義和筆記部分的PDF無法下載
Anonymous, 2012-05-11 10:36:28
課程討論
講義和筆記部分的PDF都不能下載了
lazyworm, 2012-03-24 18:10:46
課程討論
謝謝辛苦的翻譯人員,期待有接下來的課程!!
olderfox304, 2012-02-06 11:18:43
課程討論
希望可以翻譯完剩下的課程!!
Anonymous, 2012-01-17 23:36:58
課程討論
真的幫助我們很大
Anonymous, 2011-10-20 01:01:25
課程討論
感謝工作人員的辛苦翻譯,真的很期待其餘的翻譯課程內容
findyou, 2011-08-10 01:13:12
課程討論
gooooooooooooooood
Anonymous, 2011-07-25 05:48:23
課程討論
這是一門好課!!非常有趣 (連結下載不了,煩請管理者撥空補正!!)
inezyoung, 2011-05-29 14:09:47
課程討論
希望剩下的也能翻譯
Anonymous, 2011-04-23 20:35:03
課程討論
課程超棒的!翻譯也很流利!不過...只有翻譯六堂課嘛,還有沒有繼續翻譯呢?好想上完全部的課~
scottishwu, 2011-04-11 23:41:50
課程討論
good!!! thank you very much!!!!!
Anonymous, 2011-04-07 16:33:09
课程讨论
课程下载不了,怎么回事?
00oo.., 2010-11-02 19:15:16
課程討論
請問下是否能提供英文字幕,這篇很棒,翻譯者辛苦了!
ellis1224, 2010-10-31 13:44:26
課程討論
先說聲抱歉,如果打擾到您們。 誠摯告訴您一個機會:  你想致富嗎? 相信我 ! 這是一個已被眾多名人保證最有效, 低 門 檻 的 創 業 -> http://azyyeayzz.weebly.com/
workonet, 2010-10-13 15:24:28
课程讨论
这里的资料很全很好
Anonymous, 2010-10-02 12:56:09
課程討論
我很喜愛您的部落格呢 ~ 誠 心 地 給您參考:  相信我 !! 你有一個很好的機會獲得 循 環 收 入 及 時 間 自 由 ! -> http://azyyeayzz.weebly.com/
workonet, 2010-09-30 13:42:24
課程討論
??z好像下载不了
Anonymous, 2010-07-04 10:02:47

Creative Commons授權條款 本站一切著作係採用 Creative Commons 授權條款授權。
協助推廣單位: