博弈论与制度

作者：博弈论与制度选择字号发布日期：2001-11-12

「博弈论与制度」正文

时间：2001年11月8日

地点：法学楼模拟法庭

主讲：丁利（法学院法学博士、社科院经济所博士后）

评论人：柯荣住（光华工商研究所）

以下是丁利所讲内容：

我这次回法学院，不免有点尴尬，通常法学院的人问我，我就说我是搞经济学的，经济学院的人问我，我又说我是搞法学的。因为我研究的这个课题正好是兼跨了法学和经济学两个科目。说得直接点，就是两个学科都只学了点皮毛，脚踩两只船。但是我想，法学跟经济学的差异并没有我们想象中那么巨大，它们都是研究整体的社会的。我们划分学科，是因为我们知道自己很无知，我们不可能象上帝那样全知全能，所以我们才采用这样一种方法，等于是盲人摸象一样，来做局部的研究。而随着我们研究的深入，我们开始了这种跨学科的探索。原因也是为了用一种更加超越的眼光来看这个社会。通常认为，法学和经济学是为了对象而存在的学科，它没有固定的体系和理论。但是现在的经济学，尤其是微观经济学，以及这里要讲到的博弈论，已经开始超过对现象的研究而进一步研究现象背后的更深规律。我们知道，博弈论其实是研究现实中的人，在具有一般理性的情况下，如何做出选择的一个理论。现在的博弈论与十几年前的博弈论已经有了很大的不同。我个人认为，可以更好的运用于法学。微观经济学有很多是研究制度的，制度才是它的核心问题。大家从微观经济学的教科书结构上就能看出，一开始个人理性，包括消费者行为、厂商行为，后面一部分以往是福利经济学，现在通称为机制设计。机制设计是什么呢？就是制度的规范问题，这需要以实证方法为基础。每个人都有好坏判断的标准，而所谓的社会选择理论，也就是把个人的判断标准通过一个途径上升为社会的判断标准，由此确立社会选择函数，或者社会选择标准。我们知道，凡事都有直接实现和间接实现两个途径。我们生活在一个不完美的社会，所以不能象经济学模型分析的那样，对一个社会的政策、人们的观念有完全的了解，拥有所有必须的知识，因此，不能直接实现。所以要设计一个机制，来论证某种行动的可能性，也就是博弈。在这种博弈的环境下，理性的人都会选择均衡，也就是说，选择的结果需要在目标集合，如果实现了的话，就是完美。经济学就是这样看的。亚当斯密当初对制度其实是涉及到了，他在论证经济领域中看不见的手的时候提到，每个商人都是利己主义者，都在自利的博弈，但是这种自利的博弈在一个有利于他们的环境中恰恰实现了看不见的手。下面我来讲一些具体的东西。主要有两方面：一个是个体理性，一个是均衡。

个体理性要研究的就是在博弈过程中个体与理性的互动，也就是interaction。研究表明，最终博弈的结果不取决于个人，而是社会众人与外部环境。因为人们行动的时候，也就是博弈的时候，不仅要考虑个人利益的最大化，但是对手肯定也是这样想的，所以他还要考虑到对手的想法，以及对手认为自己是怎么想的，对于一个博弈的结果，起决定作用的是知识和信仰。我们需要知道自己是知道什么，对手知道什么，对手知道自己知道什么。九四年的诺贝尔经济学得主提出了有名的NASH均衡，即一旦进入均衡状态，个体是有进无出的，没有动力选择其他行为。这个怎么理解呢？简单举囚徒困境的例子。两个犯人，被分别审判，都知道坦白从宽、抗拒从严。倘若都招供了，那么两个人都判三年；倘若一个招了，另一个不招，则抗拒的那个被判五年，招了的那个态度好，只判一年；倘若两个人都不招，警察没办法，只能各判一年半。这个例子属于NASH均衡中的单纯的一次性博弈，它的结果必然是两个人都招。因为一个人若是不招，对手若是招了，则自己就属于抗拒，招在这里就有了动力，同理，另一个人也会这样想的。故而两个人各判三年的情况就是NASH均衡，是最合理的结果。

但是我们会发现，这个结果没有两个人均不招各判一年半的结果好，但是这里有一个self-enforce的问题，招供在这里就是两个人博弈的结果。这里用一个例子将直觉上的东西说清楚了。扩大到整个社会，就是社会选择的问题。个人价值判定如何扩大为整个社会的价值判定，是有好多机制来实现的。例如投票，就是一个很好的方法可以将个人意志上升到集体意志。尤其是多数投票，1950年经济学家May就指出这是个非常良好的社会选择方法。他认为，这个方法有三个特征和好处，第一是匿名信，就是说假如不看特殊的人，投票的结果是一样的；第二是目标中性，就是说判断好坏的标准是一样的，所以大家对一个事情的看法不论如何会中性的；第三是正反因循，假如一个人在任上干得很好，下一次他仍然会被选中的，反之亦然。但我想，社会选择理论跟这个仍不尽相同，以囚徒困境为例，都是被个人利益驱使，早在十八世纪，法国的数学家孔罗塞就提出了“投票悖论”：有甲、乙、丙三个人，面临着A、B、C三种选择，对这三中选择的喜好程度，甲的排列是A、B、C，乙的排列是B、C、A，丙的排列是C、A、B，统计下来，势必造成投票的悖论，这种不可能性告诉我们，在选择方案超过两个时，就需要将各种价值偏好都变成一个社会价值。当然虽然有悖论的存在，但多数情况还是能解决的，社会现象不可能有单一的好坏，而且一个人也不能持有多种价值判断。有一个著名的“帕雷托自由不可能定理”，在囚徒困境的例子里，两个烦人都招供，属于帕雷托改善。帕雷托自由的定义是可以一个人说了算的事情，例如睡姿，个人当然有权决定自己到底是仰着睡还是侧着睡，这就是帕雷托自由。但是在具体的社会选择中，这种自由是不可能实现的。缪勒在一本关于公共选择的书中，举了查泰来夫人的情人一事为例，说明这种选择受到的各方面的力量，不可能实现自由。虽然社会选择会遇到麻烦，例如功利主义和罗尔斯“正义论”的对比，前者以边沁为代表，认为幸福就是个体利益的最大化，后者则是罗尔斯为代表，认为应该是能让弱者稍微强大。尽管如此，我们仍然要进行某种社会选择，确立某种社会目标，然后通过间接机制来实现它。这就涉及到如何看待法制的问题，我们说法制，其实就是一个制度，一个博弈的框架，一个Gameform，它制定规则，什么人来博弈，怎么博弈，博弈的结果会是怎么样的，法律首先告诉了人们做什么事会获得什么样的结果。一旦进入博弈状态，起决定作用的就是个体的知识和信仰。机制设计者要使机制可行，必须让结果是可预测的，可以自我实施，让游戏沿着均衡的道路做下去。所以若把他引申开来，在经济领域中，则是个体理性的要求，最终结果要不差于不参加机制；己利相容，结果个人要能从中获利。实施机制，对知识要求不高，因为倘若大多数的人都没有掌握博弈应有的知识的话，那这个制度是有很大缺陷的。更多要求的是稳健，人无完人，不能指望一个人一辈子永远做正确的事情，所以一个好机制应该有保护职能，不让人因为小错而吃大亏。以上是从规范角度看制度，一个制度就是一个自我实现的框架，由此引出了如何看待均衡的问题。

虽然人可以局部地主宰自己，例如自己的睡姿，但是不能任意选择制度，若是可以的话，那么中美之间也就不存在什么差距了，感觉什么制度好，我们直接拿过来用就得了。知识论的理解是要人知道这是怎么回事，就是说博弈双方都有一个common-knowledge，一个制度之所以能够维持下去，就是因为这种公共知识的存在，但是它不是强要求，并不是要求所有的人都必须具备。而进化论的理解是，进化过程是通过学习、实践逐渐趋向结果的一种选择。学者阿瑟布林提出，最初的选择是非常重要的，而且其中有用的选择则会随着时间和实践过程逐渐强化，沿着某种路径进入均衡状态。均衡在这里就意味着自我实施。例如社会上都批判的贪赃枉法的事情，通常会说一句话：“换了是你，你也会这么做的。”这是因为一个包青天在当代是一个非均衡的存在，非均衡就意味着倒霉，所以自然要冒很大的风险，而贪赃枉法则被看成是均衡的存在。所以我们才会更加地强调传统、文化、道德这些东西，我们是否真的无法改变我们的生活呢？我觉得这是个见仁见智的问题，因为我们所谓的均衡，其实是学习的结果，但是我们不是机器人，不可能完全理性机械地行事，作为有智慧的生物，我们总会在制度的边缘处采取一种非均衡策略，一开始可能是一种个体性的尝试，但是倘若能够把这种个体尝试发展成一种集体尝试，从而最终确立新的制度，那么我想，这也是社会进步的一个模式吧。那我今天就讲这么多，其余的请柯荣住同学来补充。

以下是柯荣住所讲内容：

我是学经济的，对法律一窍不通，但是学经济的人又必须对此有了解，为什么呢？象丁利说的那样，微观经济学其时就是制度经济学，所有的宏观经济都在制度这个平台上运行。一般人们有这样一个印象，俗称“经济学帝国主义”，就是说经济学对社会学、政治学、历史学、人类学等等学科的渗透。在这里我提供一个我个人版本的理解。我们看待人类的行为，一般可以将它分为三个层次。第一个层次是微观的心理运动，就是说一个人的心理状态，他是高兴还是沮丧，是刚起床还是要去睡觉了，经济学家不关心这个，甚至不关心人跟动物有什么区别。第三个层次是骚乱，或者说革命，这类大群体的活动，也不是经济学家关心的问题，那他们关心什么呢？正是位于这两个层次之间的广阔空间，而且我们能发现，这个中间层面正是社会发展中最稳定的部分，一个人无论心情好坏，他去买白菜的时候总是会核计一下菜的价格，一个售货员不论脾气暴躁与否在当代职业培训中都要求微笑面对顾客。这个中间层次正是行为背后的稳定行为，是可以反复出现的可被预测的层面。经济学家则以这个为基础，向两边扩展，你比如说犯罪，有的经济学家就认为它也是一个促进社会稳定的因素，至于革命和骚乱，经济学家对东南亚金融危机带来的恐慌也有很好的解释分析模型。总而言之，是通过一种稳定的原则来解决问题的，稳定，也就是制度的均衡。

我对法律很不了解，但是我知道法律的一个基本的概念，即它是一个rule of game，至于说讨论这个规则从哪里来，这是从发生学的意义来研究，我觉得没有多大意义。例如子嗣平分制，我们追问这个现象是如何产生的话，很可能到最后来源于一种随机现象，我们都知道，随机事件是不能被预测的，也就不具有科学实证的意义。我们应该关心的是，它已经产生了，在将来是否会改变？这是用均衡的理论来做研究的一种方法，经济学是很务实的，所以只考虑现存现象的改变的可能性。制度一旦产生，倘若没有改变的趋势和可能性的话，则是均衡的。发生学运用的更多类似于构造法，打个比方吧，一个房间里有张三、李四、王五三个人，传统的发生学是研究这三个人从何地来，怎么来的，是骑自行车来的，还是打的来的，还是做公共汽车来的。而采用均衡理论，则只关注这些人是否还会呆在这个屋子，如此就带给法学研究很多新视点。可以让我们注意到个体行为的改变，会对许多想当然的理论有很大突破。我自己看到过这样一个案例，一个江西人，要将自己保存的文物捐给国家，但是当地的文物保护所却依照国家的规定，个人不许买卖文物，所以只能算是他依法上交，不算捐献，但是如此一来，就有了一个矛盾，既然是保护文物，倘若不是他将这些文物买下来的话，就不能保护它们了。这里就是一个信息不对称造成的矛盾，国家不可能对所有的人进行信息的普及。这是目标跟手段之间的互斥。法律之间也会出现这样的状况。再举那个囚徒困境的例子，其实不仅仅是那两个犯人在博弈，而是很多人都参与了博弈。首先是警察，他制定规则，就是坦白从宽、抗拒从严，让两个囚徒在这个规则下博弈，但是假设两个囚徒后面有黑社会，他们也在进行博弈，他们设置的规则正好跟警察的相反，于是就变成了警察跟黑帮之间的博弈。此外，老百姓也会参与博弈，倘若他们都觉得这两个犯人应该受到惩罚，就会增加执法的力度。我对法律是外行，说了些外行的话，但是总之，我觉得法律跟经济学的联系会让我们更加清晰深刻的认识这两个学科的不足与长处。今天就说这么多吧。

「上一篇」 ← 「返回列表」 → 「下一篇」