第五章理性选择与功能的解释（第5/10页）

一对一囚徒困境博弈所得出的很有说服力的结论——背叛是占优势的战略——就是依靠这种个人主义式的假设。博弈者被假设是“支配欲望很强的个体”（Macpherson, 1962; Ruggie, 1983a, p.277）。从算计的意义上讲它们是理性的：它们试图在不受道德原则和公平标准的影响下将它们预期的效应最大化。然而通过一个共同的社会，由互动的期望联系在一起的利己主义的博弈者们，可能在它们似乎共享道德标准的情况下行动。例如，假设在我们这个例子中有两个囚犯是一个犯罪群体（例如黑手党）中的成员。在这种条件下，我们不会指望他们作出坦白。这种行为并不必然反映他们任何非理性的东西，或者任何道德的原则，所以出现这种行为，是因为在他们的支付结构下，这些行为者作为一个持续存在组织中的共同成员的效应影响的结果。坦白无异于宣判自己的死期，那个坦白的家伙不会有好下场。因此，这些囚犯所面临的一种假想的博弈结构图式将是这样的：

	合作	背叛
合作	R，R（4, 4）	S，T（3, 2）
背叛	T，S（2, 3）	P，P（1, 1）

这种博弈当然不是囚徒困境博弈了，尽管地方检察官试图把它作为一个囚徒困境博弈来对待。相互的合作而不是告密对两个博弈者来说是占优势的战略，博弈平衡出现在左上角（R, R）上。

理性和道德

即使社会的联系比像黑手党这样的组织内部的联系更少团结性和强制性，但是如果至少有一个博弈者持合乎道德的观点，珍视合作，谴责对他人有害的行动，表面的囚徒困境博弈可能具有不同的支付图式。如果A是一个非常守道德的人，他将会因为在一个试验者的诱惑下进行告密而在良心上感到内疚，备受折磨；而B则是博弈论中假设的不守道德的利己主义者，那么一个假想的囚徒困境博弈支付图式将是这样的：

	B（合作）	B（背叛）
A（合作）	R，R（4, 3）	S，T（3, 4）
A（背叛）	T，S（2, 1）	P，P（1, 2）

在这个博弈中，A的优势战略是合作，而B的优势战略是背叛，那么结果（S, T）是任何一个博弈者都不想改变的稳定平衡结果。A宁愿做一个因被对方欺骗受到损失的傻瓜，也不愿做背叛这样的事。

从这个博弈图式自身来讲，博弈者道德之间的差别并没有对理性选择理论提出多大困难。我们可以理解A的行为是理性的，因为她试图将她的预期效应最大化，虽然她不是自私自利的，然而她却将别人的偏好纳入到自己的效用函数中。利他主义者和那些道德高尚的人可能同最粗俗的实利主义者和彻头彻尾的恶霸一样，都可能是理性的。他们的行为违反的是利己主义的假设，而不是理性这个假设。理性选择的理论家们有时不能认识到这个事实，相反却假设这种行为一定是非理性行为的结果而不是一种非利己主义的偏好函数的结果。例如，那种在康德道德律令基础上对组织作出贡献的行动，促进着个人对于共同的善的认识，哈丁（Hardin, 1982, pp.117—124）就把这种行为称为“超理性”（extrarational）的。

理性选择分析并不必然意味着人们都是利己主义者。但是使用理性选择的逻辑，一个人还需要作一些关于行为者价值观念和利益的假设，因为确切地讲，如果不考虑到行为者的价值观念和利益，理性选择的逻辑在经验上还是缺乏力量的。任何理性分析都不得不假设一个先在的权力、预期、价值观以及准则的背景，这些因素对利益的决定和估算的作出产生着影响（Field, 1981）。我们可以同假设行为者是“支配欲望很强的个体”一样，去假设行为者受到社会流传下来的价值观念的深深影响，或者假设行为者是根据公平原则来行事的。

重复囚徒困境博弈与小集团中的集体行动问题

在了解理性选择理论这些局限性之后，我们可以再次考虑囚徒困境博弈问题。表面上看，令人信服的结论是上面所说的“背叛是占优势的战略”，这个结论取决于这样一个假设，也就是博弈只进行一次，或者最多也只是在很短的时间中进行。如果这种博弈由同样的博弈者重复进行博弈，也就是说，在重复囚徒困境博弈中，人们一般都认为博弈者可能理性地采取合作的战略（Hardin, 1982，p.145；也见Taylor, 1976，第5章）。[2]这种差别的根本原因是在多次囚徒困境博弈中，背叛行为从长远来说是得不到回报的，因为因此获得的短期收益一般来说将会被紧随其后的远期相互惩罚的代价所超过。当然，要使合作得以发生，未来的回报必须受到珍视。相反，如果博弈者和约翰·凯恩斯一样强调“长远来说我们都是要死的”，那么他们在当前可能宁愿背叛，而不愿通过合作获得更好的结果。合作的激励因素也取决于一个博弈者的对手对打击背叛行为的意愿。当和一个道德高尚的人或者一个懦夫进行博弈时，作为一个恃强凌弱者，其行为可能要为未来付出代价。艾克斯罗德（Axelrod, 1981, 1984）已经说明，当未来的回报是有足够价值的时候，“一报还一报”（tit for tat）的战略在各种各样的环境下都是很得势的战略，艾克斯罗德揭示出的这种博弈战略从技术意义上讲是很有力和稳定的。采用这种战略的博弈者意味着它一开始就采用合作战略，然后不管其对手在最后一步究竟采用什么战略，它都坚持对背叛行为进行报复，对合作行为给予回报。当两个博弈者都使用“一报还一报”战略时，相互彻底的合作就会出现。艾克斯罗德指出，即使在完全的利己主义者中间，如果有足够多的潜在的合作者在一开始存在，那么合作是能够出现的。

书籍推荐：沙与沫随园食单大象孤儿道林·格雷的画像苏菲的世界列那狐的故事

第五章 理性选择与功能的解释（第5/10页）

理性和道德

重复囚徒困境博弈与小集团中的集体行动问题

第五章理性选择与功能的解释（第5/10页）