關於當前中國大陸政治結構的博弈論解釋(康曉光)

欄目:諫議策論
發布時間:2010-04-05 08:00:00
標簽:
康曉光

作者簡介:康曉光,男,西元一九六三年生,遼寧沈陽人。現任職中國人民大學公共管理學院教授、中國人民大學中國公益創新研究院院長。著有《君子社會(hui) ——國家與(yu) 社會(hui) 關(guan) 係研究》《陣地戰——關(guan) 於(yu) 中華文化複興(xing) 的葛蘭(lan) 西式分析》《中國歸來——當代中國大陸文化民族主義(yi) 運動研究》《仁政——中國政治發展的第三條道路》《起訴——為(wei) 了李思怡的悲劇不再重演》《NGOs扶貧行為(wei) 研究》《法倫(lun) 功事件透視》《權力的轉移——轉型時期中國權力格局的變遷》《地球村時代的糧食供給策略——中國的糧食國際貿易與(yu) 糧食安全》《中國貧困與(yu) 反貧困理論》等。

 
 
 
 
 
 
 
 
作為內生博弈規則的精英聯盟
——關於當前中國大陸政治結構的博弈論解釋
作者:康曉光
 
 
一、問題的提出
    
    在分析改革以來中國大陸的政治發展模式和政治穩定問題的3篇文章中,我指出,20世紀90年代中後期,在中國大陸,市場經濟體製已經取代了計劃經濟體製,為了支持市場的有效運行,政府賦予公眾“消極自由”,相應地,權威主義政治取代了毛時代的極權主義政治。

    與此同時,市場也造就了新的社會集團並改變了各個集團的相對地位。經濟精英和知識精英崛起,進入社會上層,而工人和農民則淪入社會底層。製度和群體組成的變化對統治者提出了挑戰。他們必須重新回答“誰是我們的敵人,誰是我們的朋友”這一“統治的首要問題”。

    統治集團的回答是建立精英聯盟,即政治精英與經濟精英和知識精英結成聯盟,而精英聯盟的機製可以概括為“行政吸納政治”。我還運用這一模型解釋了這一時期中國大陸政治穩定的原因,並分析了市場、權威主義政治和精英聯盟如何造就了威脅政治穩定的因素。

    在改革之前和整個改革過程中,政府始終保持了高度的自主性,也就是說,它沒有成為任何社會集團的“俘虜”。它淩駕於所有集團之上,對全社會實行權威主義統治。政治精英不但剝奪了大眾的政治權利,也剝奪了社會精英的政治權利。那麽,為什麽日益壯大的社會精英會接受或默認這種權威主義政治秩序呢?這是因為統治集團向他們提供了經濟賄賂,甚至做出了適當的政治讓步。通過掠奪大眾的經濟利益並與社會精英分享掠奪成果,政治精英不但滿足了自己的利益要求,也滿足了社會精英額外的經濟利益。這是社會精英同意放棄政治權利的根本原因。“剝奪弱者,滿足強者”是精英聯盟的本質。實際上,精英聯盟也就是分贓聯盟。

    那麽,精英聯盟是偶然的,還是具有某種必然性?是統治者強加於社會的,還是所有參與者共同締造的?是統治者愚民政策的成果,還是在完全信息環境中所有參與者共同選擇的結果?是人為的設計,還是自發的秩序?是穩定的,還是不穩定的,而失去穩定的條件又是什麽?本文將運用博弈理論探討上述問題。我將在Weingast和青木昌彥的研究成果的基礎上開展工作,並期望這種努力能夠進一步深化我們對中國大陸現行政治結構的理解。
    
    二、構造博弈論模型
    
    本文將運用完全信息動態博弈理論尋求對精英聯盟的解釋。為此,需要確定動態博弈的擴展式表述,即確定博弈的參與者集合、參與者的行動順序、參與者的行動集合、參與者的信息集、參與者的報酬函數。
    
    參與者集合
    
    這場博弈的參與者包括政府(也可以稱之為“政治精英”或“統治集團”)P 、社會精英(包括經濟精英和知識精英)E 、社會大眾M.

    把社會成員劃分為統治集團、社會精英和大眾,其依據是各個集團與現實政治秩序的利益關係及其挑戰現實政治秩序的動機和能力。而且,這種劃分方法也適合下麵將要展開的分析的需要。這正是我從眾多的相互競爭的群體分類模式中選擇這種三元(統治集團/社會精英/大眾)分類模式的主要原因。

    關於參與者有兩個重要假設:第一,參與者都是追求自身利益最大化的理性經濟人。第二,參與者擁有關於這場博弈的“完全信息”。這意味著,每個參與者都知道大家都是“理性經濟人”,都會按照同樣的邏輯思考和選擇,都知道其他參與者的行動順序和行動集合,都知道每個參與者過去的選擇情況,也都知道博弈的報酬函數。更為重要的是,每個參與者還知道其他參與者也了解這些信息,而且知道它們也知道它也了解這些信息。
    
    行動順序
    
    假定參與者的行動順序為,政府首先做出選擇,然後精英做出選擇,最後大眾做出選擇。
    無論是改革之初,還是在整個改革過程中,在力量對比格局中,政府始終處於絕對優勢地位,所以,假設政府最先出牌是合理的。

    設G1為按照“政府→精英→大眾”順序行動的博弈模型,G2為按照“政府→大眾→精英”

    順序行動的博弈模型,而且G1與G2的唯一區別是參與者的行動順序。下麵我們僅僅對G1展開分析。但是,隻要對G2重複同樣的分析,就可以發現兩種分析結果並沒有“實質性差異”。

    所以說,在我們的模型中,精英和大眾誰先出牌並不重要。
    
    行動集合
    

    為了定義“剝奪”,需要確定一個基準狀態,如諾奇克所謂的“最小政府”。這個“最小政府”也可以理解為亞當?斯密的“守夜人”。為維持一個“最小政府”,社會必須向政府提供必要的利益。

    但是,在“必要利益”之外,政府還有可能追求更多的利益,即“額外利益”。為了追求額外利益,政府需要剝奪大眾或精英的經濟或政治利益。政府共有4種可行的行動,即S1={不剝奪精英,不剝奪大眾}、S2={不剝奪精英,剝奪大眾}、S3={剝奪精英,不剝奪大眾}、S4={剝奪精英,剝奪大眾}.現在,不考慮“賄賂”行動。

    精英和大眾的策略包括“反抗”或“默認”,C={反抗},A={默認}.
    
    信息集
    
    假設每個參與者都知道所有參與者過去的選擇情況。這意味著,在動態博弈的任一階段,在該階段采取行動的參與者對博弈的各個方麵都是“完全知情”的,隻有那些將在以後發生的情況除外。
    
    報酬函數
    
    在最小政府狀態下,設T 為政府獲得的必要利益,Γe 為精英的收益,Γm 為大眾的收益。

    設Tp為精英或大眾被政府剝奪的政治利益。政府獲得的額外政治利益等於精英和大眾的損失之和。一般來說,在權威主義政治中,Tp是政府的“當然權利”,所以下麵的討論局限於對經濟利益的剝奪。

    設Te為政府追求的額外經濟利益。

    Ce為精英遭到政府剝奪時進行反抗的代價。Cm為大眾遭到政府剝奪時進行反抗的代價。

    Ces 為精英反抗時政府付出的代價,Cms 為大眾反抗時政府付出的代價,Ci為政府采取行動Si(i=1、2、3、4)時精英和大眾共同反抗時政府付出的代價。

    注意:第一,隻有在與“被剝奪的額外利益”進行比較時“反抗的代價”才有意義。第二,Ce、Cm、Ces 、Cms 是“政府的鎮壓能力”和“被統治者的反抗能力”的函數。當其他條件相同時,政府的鎮壓能力越強,被統治者反抗的代價(Ce、Cm)越大,政府為鎮壓而付出的代價(Ces 、Cms )越小。同樣,當其他條件相同時,被統治者的反抗能力越強,其反抗的代價(Ce、Cm)越小,而政府的鎮壓成本(Ces 、Cms )越高。

    假設精英集團與大眾集團無法事前達成可信的私下交易。這個假設對於中國大陸是完全合理的。這是因為,兩個集團的規模都太大,根據奧爾森的集體行動理論,很難組織有效的集體行動,而且,更為重要的是,權威主義政府幾乎剝奪了公眾組織集體行動的一切手段。

    首先,考慮政府選擇{不剝奪精英,不剝奪大眾}時的報酬函數。注意,無論是“剝奪”

    還是“不剝奪”都僅僅指“額外的經濟利益”,而不包括“額外的政治利益”。再強調一次,一般情況下,我們把“額外的政治利益”視為權威主義政府的“當然權利”。如果精英和大眾同時反抗,則反抗成功,政府不但得不到“額外利益”,還要付出代價C1,所以政府的收益為T ?C1.同時,由於精英和大眾都未受到剝奪,但要為反抗付出代價,所以兩者的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認,則反抗無效,政府剝奪兩者的政治權利2Tp ,同時付出代價Cse ,收益為T+2Tp ?Cse ;而精英喪失政治權利Tp,並付出代價Ce,收益為Γe ?Ce?Tp;大眾則僅僅喪失政治權利Tp,收益為Γm ?Tp.同理,可以得到精英默認而大眾反抗的報酬函數值。如果精英和大眾都采取默認,則政府不負任何代價剝奪兩者的政治權利2Tp ,收益為T+2Tp ;而精英和大眾也僅僅失去自己的政治權利Tp,收益分別為Γe ?Tp和Γm ?Tp.

    政府選擇{不剝奪精英,不剝奪大眾}時的報酬函數
 

    
 

    在討論政府選擇S2的報酬函數之前,先討論一下精英和大眾各自的“反抗”行為。假設精英的反抗能力遠遠大於大眾,大眾不可能成功地單獨反抗政府,但隻要精英“全力反抗”,即使沒有大眾的配合,政府的剝奪行動也將失敗。再假設精英隻有在自己的“額外經濟利益”

    受到剝奪的時候,才會“全力反抗”,而當大眾受到剝奪時,精英的反抗將會“打折扣”。

    中國大陸的現實支持這一假設。由於政府壟斷了暴力和集體行動資源,所以除了政治精英以外,其他社會集團都處於“一盤散沙”狀態,社會精英和大眾隻能采取消極反抗,無法組織有效的積極反抗。大眾的消極反抗手段極為有限,非經濟性手段包括上訪、靜坐、罷工、遊行、盜竊、殺人、破壞,經濟性手段包括罷工和怠工。但是,政府可以輕易製服大眾的非經濟性手段。大眾危害經濟業績的能力也極為有限。他們是無產者或小自耕農,必須千方百計出賣自己的勞動力以求維持生存。因此,除了好好幹活,他們唯一的選擇就是挨餓。但是,精英就不同了。經濟精英可以拒絕參與經濟活動,如停止投資、向海外轉移資產等等。經濟全球化進一步強化了他們的權力。知識精英特別是其中的專業人士對現代經濟運行的業績具有直接的影響,而且知識精英可以幹預輿論、鼓動學生鬧事、甚至自己上街鬧事。所以,精英的消極反抗會對經濟發展產生直接的、顯著的負麵影響。如今,官方意識形態已經失去了提供合法性的作用,政府的合法性嚴重依賴於經濟增長業績。對於政府來說,經濟衰退或停滯無異於滅頂之災。這意味著,精英的消極反抗可以給政府造成極大的損害。

    現在考慮政府選擇{不剝奪精英,剝奪大眾}時的報酬函數。如果精英和大眾同時反抗,則反抗成功,政府的收益為T ?C2,而精英和大眾的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認,由於精英自己沒有受到剝奪,所以不會“全力反抗”,其結果是政府隻能從大眾那裏奪得一部分Te,如λTe,0<λ<1.當然,政府會成功地剝奪精英和大眾的政治利益2Tp ,但要付出代價Cse ,其收益為T+λTe+2Tp?Cse.相應地,精英喪失政治權力Tp,並付出反抗代價Ce,收益為Γe ?Ce?Tp.大眾喪失政治權力Tp和經濟權利λTe,收益為Γm ?λTe?Tp.如果大眾反抗而精英默認,則反抗失敗,政府成功地剝奪大眾的Te,同時還剝奪大眾和精英的2Tp ,但要付出代價Csm ,其收益為T+Te+2Tp?Csm.而精英僅僅失去Tp,收益為Γe ?Tp.大眾不但失去Tp和Te,還要徒勞地付出反抗的代價Cm,其收益為Γm ?Cm?

    Te?Tp.如果精英和大眾都放棄反抗,則政府同時剝奪兩者的政治權利2Tp ,並從大眾那裏掠奪經濟利益Te.

    政府選擇{不剝奪精英,剝奪大眾}時的報酬函數

    
 

    下麵,考慮政府選擇{剝奪精英,不剝奪大眾}時的報酬函數。S2與S3的區別在於被剝奪的是精英而不是大眾。如果精英和大眾同時反抗,則反抗成功,政府、精英、大眾的收益分別為T ?C3、Γe ?Ce、Γm ?Cm.如果精英反抗而大眾默認,注意此時精英自己受到剝奪,所以它將“全力反抗”,其結果是政府的剝奪行動失敗。在這種情況下,政府得到2Tp ,但付出代價Cse ,收益為T+2Tp ?Cse ;精英保住了Te,失去Tp,付出反抗代價Ce,收益為Γe ?Ce?Tp;而大眾僅失去Tp,收益為Γm ?Tp.如果精英默認而大眾反抗,則反抗失敗,政府得到2Tp 和Te,但要付出代價Csm ,收益為T+Te+2Tp?Csm.精英同時失去Tp和Te,收益為Γe ?Te?Tp.而大眾將失去Tp,並付出代價Cm,收益為Γm ?Cm?Tp.如果精英和大眾都選擇默認,則政府的收益與S2相同,但是與S2相比,精英將多失去Te,而大眾則少失去Te.

    政府選擇{剝奪精英,不剝奪大眾}時的報酬函數

    
 

    最後,我們考慮政府選擇{剝奪精英,剝奪大眾}時的報酬函數。假設政府分別剝奪精英和大眾規模為Te的經濟利益。按照上述邏輯,我們可以得到這種情況下的報酬函數值。

    政府選擇{剝奪精英,剝奪大眾}時的報酬函數
 
 

    

    在此,討論一下T ?C1、T ?C2、T ?C3、T ?C4的關係。可以合理地假設,在不同的情況下,政府為應付反抗而付出的代價是不同的,這種代價應該與反抗的強度成正比,而反抗的強度又應該與被剝奪的強度成正比。所以有C1T ?C2>T?C3>T?C4.
    
    三、求解模型
    
    我們所構造的博弈模型是一個有限完美信息博弈。Zermelo 和Kuhn證明,一個有限完美信息博弈有一個純戰略納什均衡。對於有限完美信息博弈來說,逆向歸納法是尋找子博弈精煉納什均衡的最簡便的方法。

    在動態博弈過程中,在每一個決策結上,參與者在權衡各種可行行動的成本和收益的基礎上做出自己的選擇。具體來說,精英將根據Ce與Tp、Te、Tp+Te 的關係進行決策,而大眾則根據Cm與Tp、Tp+λTe、Tp+Te 的關係進行決策。為了尋找子博弈精煉納什均衡,首先,以Ce為橫軸,以Cm為縱軸,做一個二維笛卡爾坐標係。然後,用水平線Cm=Tp 、Cm=Tp+λTe、Cm=Tp+Te和垂直線Ce=Tp 、Ce=Te 、Ce=Tp+Te把第一象限劃分為一些小區域。最後,運用逆向歸納法分別尋找每一個小區域內的子博弈精煉納什均衡。

    
 

    

    全麵掠奪型權威主義國家

    
    在第一類情況下,子博弈精煉納什均衡為{S4,A ,A},即政府選擇{剝奪精英,剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.政府剝奪所有人的政治和經濟權利,而被剝奪者則保持沉默。我把這種情況稱之為“全麵掠奪型權威主義國家”。

    “全麵掠奪型權威主義國家”出現的條件是:Ce>Tp+Te,或者Cm>Tp+Te並且Tp當Ce>Tp+Te時,精英反抗政府剝奪的代價(Ce)高於因反抗而避免的損失(或默認政府剝奪時所受的損失)(Tp+Te ),因此無論大眾采取什麽行動,精英的最優選擇都是放棄反抗。由於精英放棄反抗,加之大眾的單獨反抗是無效的,因而無論大眾的態度如何,政府都可以放心大膽地掠奪所有的社會成員。

    當Cm>Tp+Te時,大眾反抗政府剝奪的代價(Cm)高於因反抗而避免的損失(或默認政府剝奪時所受的損失)(Tp+Te ),因此無論精英采取什麽行動,大眾的最優選擇都是默認。由於精英單獨反抗最多可以保住Te,但必須付出代價Ce,又由於Te由此可見,隻要與被剝奪的利益相比反抗的成本足夠高,被剝奪者就將默認剝奪,而政府就可以肆無忌憚地掠奪。
    
    掠奪大眾型權威主義國家
    
    在第二類情況下,子博弈精煉納什均衡為{S2,A ,A},即政府選擇{不剝奪精英,剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.我把這種情況稱之為“掠奪大眾型權威主義國家”。

    “掠奪大眾型權威主義國家”出現的條件是:TpTp+λTe.

    當Tp當CeTp+λTe,即大眾與精英同時反抗的代價(Cm)大於因此而避免的損失(Tp+λTe),所以大眾不會與精英同時反抗政府。由於精英單獨反抗既不能保住Tp,又要付出代價Ce,所以在這種情況下,精英的最優選擇還是默認。其結果是政府可以安全地剝奪大眾。

    需要說明的是,在區域10和區域11中,{S3,A ,A}也是子博弈精煉納什均衡。當存在多個均衡解時,政府可以在其中任選其一。考慮到政府傾向於保持策略的連續性,因此可以合理地假設它將選擇{S2,A ,A}.
    
    最小權威主義國家
    
    在第三類情況下,子博弈精煉納什均衡為{S1,A ,A},即政府選擇{不剝奪精英,不剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.政府滿足於剝奪精英和大眾的政治權利,而不會剝奪它們的經濟權利。我把這種情況稱之為“最小權威主義國家”。

    “最小權威主義國家”出現的條件是:Tp當Ce如果政府放棄剝奪大眾的經濟利益,即選擇S1,由於Tp權威主義崩潰

    在第四類情況下,精英和大眾將為保護自己的政治利益而聯合反抗政府,而政府又無力鎮壓這種全民反抗,於是權威主義政治終結。我把這種情況稱之為“權威主義崩潰”。
    
    “權威主義崩潰”出現的條件是:Cm當Ce精英勾結型權威主義國家
    
    當Ce隻要Te>Tp ?Ce,政府就可以從取自大眾的經濟利益(Te)中拿出一部分(Δ)分給精英,使得Te >Δ>Tp ?Ce.此時,新的報酬函數為
 

    
 
 

    由於Te >Δ>Tp ?Ce,所以Δ?Tp>?Ce,所以Γe+Δ?Tp >Γe ?Ce.對於精英來說,這意味著,{受賄並默認}要比{反抗}更好。這樣一來,政府通過賄賂精英消弭了精英反抗的動機,而精英收受賄賂在之後也就會默認政府對大眾進行掠奪。於是,{{賄賂精英,剝奪大眾},精英受賄並默認,大眾默認}就是一個新的子博弈精煉納什均衡。其對應的報酬函數的值為{T+Te?Δ+2Tp,Γe+Δ?Tp,Γm ?Te?Tp }.

    曆史現實可以幫助我們理解精英勾結型權威主義國家出現的機製。隨著市場和經濟的發展,精英的勢力日益膨脹。當精英的實力足夠大時,一方麵,他們具有較強的反抗政府的能力,或者說,反抗政府的代價較小,即Ce較小,另一方麵,他們對政治權利的要求較強,即Tp較大,於是就會出現Ce在此前的3篇文章中,我已經描述了統治集團“賄賂”社會精英的具體形式。例如,通過不斷推進市場化改革,實施鼓勵經濟發展的政策,禁止獨立工會,壓製輿論,降低環境標準,政府為經濟精英創造了最有利的賺錢環境。通過錢權勾結和裙帶關係,政治腐敗還為經濟精英創造了可觀的非法獲利渠道,如侵吞國有資產、偷稅漏稅、走私、騙匯、生產和銷售假冒偽劣產品等等。此外,通過吸收入黨,安排進入政府、人大和政協,資本家和經理們的“麵子”(政治地位的象征)也得到相當程度的滿足。再如,通過提供適當的言論空間,進入官僚係統和經商的機會,大幅度提高工資,高標準的就業、醫療、退休保障,政府也滿足了知識精英的利益訴求。需要指出的是,這些賄賂形式並非都是統治者處心積慮的設計,有的屬於無意為之,有的甚至是無可奈何的妥協或權宜之計。
    
    其他可能情況
    
    如果政府垮台會導致社會失去秩序,陷入全麵混亂,其結果是全社會都遭殃,而不僅僅是政府遭殃。對應的報酬函數的值為{T ?C ∞,Γe ?C ∞,Γm ?C ∞}.C ∞表示一種無法承受的代價。而且所有參與者都明確地了解這一點,即形成為一種社會共識。那麽,不但是政府,而且精英和大眾都將極力避免共同反抗局麵的出現,結果是共同反抗不會出現。我把這種情況稱之為“政府綁架社會”。在這種情形下,政府就可以為所欲為。因此,聰明的政府總是極力製造自己是秩序的唯一提供者的“共享信念”。

    如果精英和大眾都已經高度組織化,就存在雙方達成事前協議的可能性。在這種情況下,被剝奪的一方可以要求另一方和它一起聯合抵製政府,事成之後,它將給後者支付補償。在這種情況下,政府將放棄剝奪行為,轉型成為“最小權威主義國家”。

    如果Ce如果精英和大眾的實力旗鼓相當,則政府或是同時剝奪兩者;或是任選其一進行剝奪,而不剝奪另一個;或是任選其一進行剝奪,同時賄賂另一個;或是放棄任何剝奪企圖。根據North 、Weingast和青木昌彥,在這種情況下,也許會出現“民主型國家”或“社會契約的民主型國家”。

    如果大眾的實力超過精英,則大眾將取代上述分析中精英的位置。如果CmTp?Cm,則政府將剝奪精英,並向大眾行賄。這意味著,建立社會保障製度或俾斯麥型的福利國家。

    我們可以進一步放寬研究的視野。例如,“精英”可以進一步劃分為“經濟精英”和“知識精英”。這樣一來,參與者集合擴大了。但是,隻要模型仍然是有限完美信息動態博弈,就可以運用同樣的方法求解,隻不過求解的過程稍微複雜一點而已。

    隻要重新定義參與者、行動策略和報酬函數,模型可以適用於計劃時期的中國大陸。例如,可以用“城市”(或“工業部門”、“市民集團”)代替“精英”,用“農村”(或“農業部門”、“農民集團”)代替“大眾”等等。根據同樣的邏輯,我們可以發現,政府將傾向於采取{不剝奪城市,剝奪農村}或{賄賂城市,剝奪農村}策略。同樣,經過適當調整,我們的模型也可以分析建國前後的“土地改革”和“社會主義改造”運動。在這種情況下,“精英”可以是“地主”、“資產階級”或“知識分子”。根據同樣的邏輯,我們可以發現,在計劃體製下或為了建立計劃體製,政府必然傾向於選擇{剝奪精英,不剝奪大眾}或{剝奪精英,賄賂大眾}策略。
    
    四、博弈論模型傳達的信息
    
    本文所作的一切,不是為了把已有的思想“翻譯”為數學語言,即僅僅用博弈論術語重新表述過去的思想。實際上,這種分析能夠為我們提供許多重要的“新知識”。它不但可以幫助我們加深對現行政治結構的理解,也可以加深我們對政治演變曆史的理解。

    改革之初,在計劃體製下,政府實施的是{賄賂城市,剝奪農村}策略。從計劃到市場的經濟轉型徹底改變了博弈的外生規則。參與者變了,報酬函數也變了。在20世紀80年代,相對於毛時代,政府采取了{不剝奪精英,不剝奪大眾}策略。這一策略的另一種標準表述形式為“放權讓利”,即政府同時降低了對精英和大眾的剝奪程度。但是,由於市場化改革帶來了巨大的增長效應,這一時期,政府的收益並沒有因為“放權讓利”而減少。這是一個“三贏時代”,即政府、精英、大眾的收益同時提高。由於受到“八九風波”的刺激,90年代初期,政府轉而實行“全麵剝奪”策略。但是,這一策略很快就被它的製定者主動放棄了。在全球化時代,對於一個嚴重依賴經濟增長為自己提供合法性的政府來說,剝奪精英無異於自取滅亡。於是,90年代中期以後,聰明的政府轉而采取{賄賂精英,剝奪大眾}策略,即統治集團與社會精英勾結起來掠奪大眾。這樣一來,中國大陸就演變為“精英勾結型權威主義國家”。在此前的3篇文章中,我把這一時期的群體關係稱為“精英聯盟”,並用“贏家通吃”概括它的利益分配效應。

    那麽,關於“精英聯盟”博弈論還告訴了我們什麽新的東西?博弈論主張,思考製度的最合理的思路是將它概括為一種博弈均衡。此前的分析表明,以市場和權威主義政治作為外生變量,那麽精英聯盟——精英勾結型權威主義國家——就是一種內生博弈規則。根據博弈論所揭示的納什均衡的基本性質,我們可以指出和解釋精英聯盟的一係列重要屬性。

    首先,精英聯盟是穩定的。在博弈論看來,作為納什均衡的精英聯盟實質上就是一種特殊的策略組合,它使得每個參與者的策略是對其他參與者策略的最優反應。而且精英聯盟是一種帕雷托最優狀態,即任何參與者都不可能在不損害其他參與者利益的條件下改善自己的利益。這也意味著,社會一旦進入這種狀態就很難從中擺脫出來,或者說精英聯盟具有很高的穩定性。

    其次,精英聯盟是自我實施和自我維係的。納什均衡是所有參與者關於博弈將會如何進行的“一致”預測。也就是說,納什均衡能夠使參與者預測到它,而且能預測到他們的對手也能預測到它。既然所有參與者能夠預測到這一均衡(精英聯盟)會出現,而且這一均衡又屬於帕雷托最優,那就沒有任何參與者有動力采用與該均衡不同的行動。在這種意義上,精英聯盟就是“自我實施的”。同時,精英聯盟也是自我維係的。參與者基於共有信念而做出的決策共同決定了均衡的再生,均衡的再生反過來又強化了共有信念。這樣一來,製度成為自我維係的。其實,製度作為一種均衡現象,隻要別人不忽略它,任何人都不敢違抗它的權威,從而對人們的策略選擇構成影響。

    最後,建立精英聯盟需要時間。博弈規則的有效性依賴於參與者是否共享某種關於博弈將如何進行的“知識”或“信念”。那麽,參與者的完全信息和共享信念來自哪裏?答案是,來自經驗,來自學習,來自實踐中的學習過程。在我們的分析中,參與者被假定為是完全理性的,而且擁有完全信息,可以預測自己和其他參與者的所有選擇及相應的結果。這是古典博弈理論的基本假設。但是,實際上,現實中的博弈參與者卻並非如此。他們僅僅擁有有限的信息和理性,並根據自己以往的經驗進行歸納推理。針對這種情況,進化博弈論假設,在每一個特定的時期,參與者的信息是有限的,而且他會根據以往的經驗做出當前的決策,以實現眼前利益的最大化。正是通過從經驗中學習,參與者才有可能積累起越來越豐富的經驗,發展出越來越有效的分析能力,進而逐漸逼近“完全信息”和“完全理性”狀態。其實,古典理性觀點的均衡概念大致上可以理解為是學習的產物。

    學習是需要時間的!學習的重要性意味著建立精英聯盟需要相當長的時間。這就解釋了,為什麽直到20世紀90年代中後期精英聯盟才出現。實際上,直到90年代中後期,全體社會成員才大致了解了與博弈有關的“完全信息”並建立了“共享信念”。在80年代,所有的參與者都缺乏信息,不理解身處其中的現實,不理解自己,也不理解自己的對手,也就是說,不了解全新的外生博弈規則。經曆了80年代持續的動蕩,特別是經曆了“八九風波”,所有的參與者都從自己的經驗中學到了許多東西,逐漸掌握了充分的信息,建立了共享的信念。正是通過持續地學習,參與者得以積累知識、完善策略、並使博弈逐步達到均衡狀態。在本文中,精英聯盟是完全信息古典型動態博弈的子博弈精煉納什均衡,但是,在現實中,精英聯盟卻是一個典型的不完全信息進化博弈均衡。其實,這並不矛盾。在一些情況下,博弈論的古典分析方法和進化分析方法會導致相同的模型解。博弈論已經證明,進化均衡總是納什均衡,而且進化均衡一旦建立,要想把它和子博弈精煉均衡的內在狀態區分開來將是非常困難的。

    至此,我們可以回答第一節中提出的問題了。我的答案是:精英聯盟不是偶然的,它是社會主義轉型時期的必然現象。精英聯盟不是統治者單方麵強加於社會的,而是所有社會集團共同締造的。精英聯盟不是統治者愚民政策的成果,而是擁有完全信息的所有社會成員共同選擇的結果。精英聯盟不是一相情願的“人為的設計”,而是一種在很大程度上不可避免的“自發的秩序”。它不但是內生的,也是自我實施和自我維係的。同時,精英聯盟也是非常穩定的,一旦形成就很難被打破。

    如果要用一句話總結本文的核心思想,那就是:精英聯盟是市場和權威政治聯姻的產兒。也就是說,隻要一個國家實行市場經濟,而且保持權威主義政治,那麽就很可能會出現“精英聯盟”。
    
    
    注釋:
1康曉光,“未來3~5年中國大陸政治穩定性分析”,《戰略與管理》(中國北京)2002年第3期,第1~15頁;康曉光,“90年代中國大陸政治穩定性研究”,《二十一世紀》(中國香港)2002年8月號,第33~45頁;康曉光,“中國:改革時代的政治發展與政治穩定”,《當代中國研究》(美國普林斯頓)2002年第3期,第29~59頁。
 
2Weingast,B.(1993),"Constitutions as Governance Structures:The PoliticalFoundations of Secure Markets",Journal of Institutional and Theoretical Economics149:286~311;Weingast,B.(1995),"The Economic Role of Political Institutions:Market-Preserving Federalism and Economic Development",Journal of Law,Economicsand Organization 11:1~31;Weingast,B.(1997),"The Political Foundationsof Democracy and the Rule of Law",American Political Science Review 91:245~263.
 
3[日]青木昌彥,《比較製度分析》,上海遠東出版社,2001年。
 
4[美]朱·弗登博格、[法]讓·梯諾爾,《博弈論》,中國人民大學出版社,2002年,第80~81頁。
 
5逆向歸納法要求,從最後一個決策結開始倒推,每一步都要剔除在該決策結上參與者的劣選擇。這就保證了,在均衡路徑上,每一個參與者在每一個信息集上的選擇都是占優選擇。其實,逆向歸納法就是重複剔除劣戰略方法在擴展式博弈中的應用。
 
6在圖3中,“賄賂”相當於把垂直線Ce=Tp 向左水平移動了Δ距離,而且Tp?Δ
 
7參閱:North ,D.and Weingast,B.(1989),“Constitutions and Commitment:TheEvolution of Institutions Governing Public Choice in Seventeenth-Century England”,Journal of Economic History 49:803~832;Weingast,B.(1997),"The PoliticalFoundations of Democracy and the Rule of Law";[日]青木昌彥,《比較製度分析》,第160~164頁。
 
8青木昌彥給製度下的定義為:“製度是關於博弈如何進行的共有信念的一個自我維係係統。製度的本質是對均衡博弈路徑顯著和固定特征的一種濃縮性表征,該表征被相關域幾乎所有參與人所感知,認為是與他們策略決策相關的。這樣,製度就以一種自我實施的方式製約著參與人的策略互動,並反過來又被他們在連續變化的環境下的實際決策不斷再生產出來。”參閱:[日]青木昌彥,《比較製度分析》,第28頁。
 
9這一論斷對處於不利境地的大眾也是正確的。大眾當然不希望自己受到剝奪,但是考慮到力量對比格局,考慮到弱肉強食的邏輯,它知道與其進行徒勞的反抗,還不如接受被剝奪的現實,這樣至少還能避免無謂的犧牲。所以,接受被剝奪的命運就是大眾的最優選擇。也正因為如此,它才能接受被剝奪的命運。
 
10製度不是“宣布”的結果。一種製度,隻有當所有的當事人真的相信並遵從它時,才能真正地成其為有效的製度。成文法、條例、命令,如果沒有人把它們當回事,它們就不構成製度。在我們的現實生活中,真正有效的製度往往並不像官方宣傳的那樣,其真實麵目需要富有洞見力的思想家來揭示。
 
    11參閱:[日]青木昌彥,《比較製度分析》,第194~200頁。
 
2003年4月10日,修改稿
 
【作者授權儒家中國網站發布】