推理的力量：政策过程的理性选择理论

2024.03.01

〔摘要〕

理性是人类宝贵的财富，所有的人造物都包含了人类智慧。理性也是公共政策研究的重要途径之一，它强调公共政策是由理性行动者之间互动产生的，从理性的视角看待政策过程所产生的理论又被称之为理性选择理论。理性选择理论植根于古典政治经济学传统，它主张基于同样的人性假设看待经济、政治和道德。由于学科的分野，目前形成了经济学的理性选择理论和政治学的理性选择理论，它们对于公共政策有不同的看法。前者从成本收益分析、多属性效用出发，讨论什么样的公共政策符合理性原则，以及如何在公共政策中思考理性个人的策略互动实现激励兼容。后者从规则和结构出发，讨论什么样的政策过程结构有利于生产合宜的公共政策，避免“衰退公共政策”的产生。这些不同视角，形成了政策过程的理性选择理论谱系，主要包括效用理论、多属性效用理论、社会选择理论、公共选择理论和博弈论等。良好的公共政策是重要的，而产生这一公共政策的土壤更重要。

〔关键词〕

推理；理性选择；决策理论；博弈论；政策过程；公共政策

〔中图分类号〕D035-01 〔文献标识码〕A 〔文章编号〕2095-8048-（2018）04-0116-13

霍布斯指出，人与动物的区别在于推理，尤其是使用语言进行推理。通过推理，人类找到了告别“人与人像狼一样战争”的自然状态，进入文明社会的路径。应该说，霍布斯发展了马基雅维利的传统，使得政治学研究从政治哲学走向政治科学，实现了政治的世俗化和研究的科学化，共同开创了基于推理和算计的现代政治科学。联邦党人更是将这一思想概括为政治学研究的经典之问：人类社会是否真正能够通过深思熟虑和自由选择来建立一个良好的政府，还是他们永远注定要靠机遇和强力来决定他们的政治组织？

公共政策是政治领域的重要活动之一，我们可以基于推理来理解纷繁复杂的政策过程吗？很多学者给出了肯定的回答，并将理性作为政策过程研究和政策分析的一种重要途径。〔1〕从理性的视角思考政策过程，意味着重视推理的作用，通过形式模型来发现政策过程中的规律与模式（Pattern）。越来越多的主流政策过程理论开始重视人的模型，讨论理性或者有限理性对政策过程的影响，理性决策发挥重要的作用。〔2〕不过，经济学和政治学中的理性选择理论对于政策研究的影响仍然不够，这尤其体现在对政策过程的研究和讨论之中。为此，本文试图重构政策过程中的政治经济学传统，突出推理在政策过程中的作用，阐述政治学和经济学中的理性选择理论对于政策过程的启发价值，并依据决策理论和博弈论的分类，对几种典型的理性选择理论进行了回顾，最后提出了理性的人能否设计理性的政策过程产生理性的公共政策的问题。

一、重返政治经济学的传统：经济学、政治学与政策过程理论

17世纪和18世纪以来的启蒙思想家有一个突出特点，他们基于同样的人性假设来思考作为整体的人类社会秩序及其运行逻辑。查尔斯·K·罗利和夫里德里克·施奈特将之概括为：“经济学、政治科学和道德哲学之间富有成效的互动主要是建立在人类是拥有目的和负责任的行动者这一形象基础之上，他们将人看作以尽可能有效率的方式追求目标。”〔3〕因此，近代以来的思想家同时是经济学家、政治学家和道德哲学家，经济、政治与道德只是不同的领域，并不影响他们从相同的假设出发来探讨不同领域的问题。

不过，随后的学科分化，导致了人们对社会的支离破碎的认知，不同学科从不同假设出发对社会不同方面进行分析。最典型的是经济学将资源配置作为核心问题，他们即便研究政治问题也将国王想象成为仁慈的君主，经济学家的主要角色是为统治者提供技术和政策建议。作为一个追求目标的理性个人，在经济市场中斤斤计较，那么他们在政治市场中会变得高尚吗？正是对这一问题的追问，开启了学科融合的路径，政治经济学被再次提上日程。重返政治经济学的传统，使得新政治经济学得以产生，公共选择理论代表了这一努力的最新成果。这一努力的结果，使得经济学和政治学共享相同的根基，即理性的个人在经济市场和政治市场中互动会产生什么样的结果和模式？

随着政治学和经济学的融合，尤其是一些从经济学视角分析政治学的经济学者和政治学者的共同倡导，这使得理性选择理论成为政治学和经济学的共同基础。理性选择理论讨论理性对于人类的意义，并以此为基础思考人类社会的运行和构造逻辑。理性选择理论的核心问题是理性的个人如何通过复杂的互动形成秩序。早期的理性选择理论主要是对经济领域的分析，随后这一思想也被拓展到政治领域，将政治选择也看作是一个理性过程。〔4〕〔5〕理性选择理论成为政治学的重要理论流派，它对政治现象提供了有竞争力的解释逻辑。

图1 基于理性选择途径的政策过程理论

〔来源：根据Lejano（2006：27）修改，增加了公共选择理论〕

政策过程作为政治过程的重要组成部分之一，也应该遵循理性选择的逻辑。保罗·卡尼将理性选择理论的特点总结为三个方面：使用模型和进行演化推理、方法论个人主义、技术理性。〔6〕在勒加诺看来，现代決策理论（modern decision theory）是由冯·诺依曼和奥斯卡·摩根斯特恩所发展，“他们假定了判断（judgement）的两种基本模型：被个人所使用和被一群人所使用”。〔7〕他根据参与决策的人数及其互动情况，将决策科学的谱系划分为决策理论（decision theory）和博弈理论（game theory）。以这一区分为基础，勒加诺将政策分析的经典理论划分为决策理论和博弈理论（见图1）。这一分类基本上代表了理性选择理论对政策过程研究的主要思路。我们认为公共选择理论是介于决策理论和博弈论的一种理论，或者说它同时包含着两种要素，可以单独成为一种类型。为此，我们将理性选择理论区分为决策理论、公共选择理论和博弈理论，决策理论更多强调经济理性，公共选择理论具有更多的政治色彩，博弈论是一种分析多人决策的方法。

二、效用理论、成本收益分析（CBA）与标准/替代方案矩阵（CAM）

经济学者为了使理性选择更容易实现，通常会用效用（utility）来对结果进行衡量。这样，选择问题就转化为效用函数的最优计算，不需要对替代方案进行两两比较，只需要对每一个替代方案的最后效用进行衡量和赋值，就可以很清晰地对效用最大化的方案进行选择。在构造效用函数时，会遵循效用的可比较性（comparability）和传递性（transitivity）假设。可比较性假设意味着替代方案可以根据偏好或效用进行比较，只存在三种结果，一种方案的效用优于、等于或劣于另一种方案的效用。传递性假设是指三个可能的替代方案之间存在传递性，如果X优于Y，Y优于Z，那么X优于Z。这两个假设使得效用本身可以比较，有利于建立效用等级（preference ordering）。在考虑效用时，由于效用通常会需要一段时间之后才能够实现，一些学者发明了预期效用（expected utility）来衡量替代方案的效用，而对替代方案的选择过程也就是预期效用最大化的过程。对于预期效用的计算，会使用概率来进行衡量，将效用值与效用发生概率相乘而获得。

效用理论用于理性选择的一个方案是进行成本收益分析，它将所有的标准都转化为金钱。一般而言，成本收益分析建立在三个基本假设基础之上，即：“（1）一个公共活动的所有成本和收益都可以用美元进行测量。（2）失败的风险和成功的机会都可以通过概率进行贴现。（3）一项资产的未来价值，或者一项未来成本与收益的现在价值都能够使用时间贴现来测量，即使用复合利率和贴现论。”〔8〕第一个假设涉及将所有成本和收益转化为货币，第二个假设是对风险的折现，第三个假设是对时间的折现。

为了更好地推进成本收益分析，一些研究者提出了标准/替代方案矩阵（criteria-alternatives matrix， CAM）。其核心思想是把替代方案放入列之中，把标准放入行之中，对替代方案的绩效根据一些标准进行赋值，将一些核心信息填写进入矩阵之中，实现替代方案的绩效比较。芒格以一个地区罪犯人数增加，监狱人满为患，指出了不同替代方案在不同评价标准中绩效表现（见表1）。〔9〕他的研究结论表明，对于替代方案的选择取决于对不同标准的权重选择，标准/替代方案更多是组织决策的工具，而不是决策本身。

很显然，对于因监狱人数增多，选择解决问题的方案而言，成本收益方法面临对一些非货币问题进行货币化。例如，对于正义的衡量，对于很快解决问题的衡量，对于减少重复犯罪率的计算，这些指标很难直接货币化。虽然芒格提出根据权重和设定标准单位值直接对所有标准进行简单加总，最后对不同备选方案的值进行比较而得到选择結果。〔10〕这一计算面临着很多问题和难题。一方面，不同单位的标准进行简单加总很显然不科学，这主要是因为不同标准包含着不同衡量准则，这些不同衡量标准之间很难进行通约化，通约化问题也是成本收益面临最大挑战，标准/替代方案只是把问题以更加明确的形式呈现出来，也没有提供了一个较好的解决方案。另一方面，每一个标准的权重赋值也是替代方案选择面临的另一重大挑战，不同标准在整个决策后果考虑中并不是同等重要的，不同人赋予不同权重也会影响结果的选择。

尽管如此，成本收益分析和标准/替代方案矩阵目前被广泛应用于政策分析之中，它成为衡量政策方案选择和推动政策变迁的重要工具。韦默和瓦伊宁结合国会预算办公室（Congressional Budget Office， CBO）的研究报告，讨论了使用标准/替代方案矩阵对拍卖无线电频道许可证、重建军队、开发数码电视、改善水资源分配等政策选择的案例分析。〔11〕成本收益分析也被应用于政策选择和政策评估分析之中，如利用成本收益分析对美国限速政策的分析等。

三、多属性效用理论（MAU）

成本收益分析属于基数货币价值范畴，它强调不同效用之间可以量化比较，货币是共同的比较单位，所有的偏好都可以基数货币价值呈现。有一些研究者对此持否定态度，他们提出了基于基数效用的多属性效用理论（multi-attribute utility， MAU），强调个人偏好以基数效用呈现，并不认为所有的目标或标准都可以转化为货币，并不认为个人之间效用可以进行简单加总，而是认为可能通过加总函数来实现。劳尔·勒加诺认为期望理论和有限理性理论是多属性效用理论的两种典型理论。〔12〕

期望理论（prospect theory）是由心理学家丹尼尔·卡尼曼和阿莫斯·特沃斯基创立，他们通过实验室模拟挑战了预期效用假设，认为人们的实际决策行为偏离了预期效用理论。〔13〕〔14〕在决策情景构造之中，丹尼尔和阿莫斯创造了两种决策情景供人们选择（见表2），论证了大部分人在面对不确定性情景的选择行为。为此，他们提出了期望理论，认为人们对于未来的预期、风险规避和冒险行为都会影响人们的决策，这一理论可以解释很多实际产生的决策行为。

从表2可以看出，按照标准的理性选择理论（rational choice theory），或者说预期效用理论（expected utility theory），决策情景1和决策情景2的A和B选项是等价的，A和B选项没有差异。但是，在实际选择行为中，在决策情景1之下，人们更愿意选择A，在决策情景2之下，人们更愿意选择B。这说明，人们的选择行为并不遵循预期行为理论，而是按照期望理论进行决策。这意味着，在面对不确定性条件下的收益选择时，人们通常会采取确定性行为，保证利益获得；而在面对不确定性条件下的损失选择时，人们通常会采取冒险行为，不愿意马上接受损失。该理论挑战了预期效用理论，认为人们对于得到1元和失去1元并不是得到同等效用，在获益时会选择风险规避行为，在受损时会选择风险冒险行为。

“有限理性”（boundary rationality）的概念是由学者西蒙于20世纪50年代提出，主要针对经济学的理性决策模型。有限理性的基本思想是人的信息加工能力是有限的，因此，人无法按照充分理性模式去行为，即人们没有能力同时考虑各种选择方案，无法总是在决策中实现效率最大化。西蒙认为在学术传统中，人们对于“理性”的认识存在两个极端，一个是以经济学和统计学为代表，完全强调理性在决策中的作用，另一个是以社会学和心理学为代表，完全不重视理性在决策中的作用。〔15〕他认为，现实中的个人决策、组织决策和政府决策既不是完全理性，也不是没有理性，而是“有限理性”。正是因为在“有限理性”的假设之下，无论是作为决策者的个人，从事集体决策的组织，还是作为决策的政策过程，都是采取“满意”决策，即从所有可能选择的方案中追求“满意”，而不是追求“最优”。

西蒙的有限理性理论对理性选择理论进行了挑战，他认为应该根据更加符合现实的假设为基础作为预设，来理解和研究人的行为及其影响。有限理性理论对政策过程产生了较大影响，间断均衡理论（PET）直接以有限理性为基础来理解政策过程中间断与均衡问题，从而解释了政策过程中的稳定与变迁问题。与理性决策模型相比，有限理性决策的模型有如下几个特点。

首先，在对目标达到一致意见之后，决策过程的第一步是决策者需要选择满意的标准，即当对各种替代方案进行选择时，决策者需要考虑在何种程度上达到满意要求。一般而言，决策者所期望的标准并非最佳水平，而是在考虑客观环境之后的一个可能达到的水平。这种所期望的水平，无论是对决策者个人而言，还是对组织决策而言，都不可能是达到最优水平的状态。

其次，一旦希望提高或达到的标准确定，第一个满足或超过决策者期望或需求的行动方案就会被选择。这就是说，决策者在所搜寻的决策方案达到满意标准时，就会停止搜寻和选择。当然，如果没有达到所希望的水平，这一选择过程会继续进行。但是如果继续进行选择仍然达不到要求，那么，决策者就可能会降低所期望的最低标准。这就是说，满意标准本身是变动的，它是随着环境给予决策者的反映和体验而不断变化的。

最后，有限理性决策模型并非同时对所有决策方案进行选择，而是按照顺序对决策方案进行排序，进行两两比较。在两个决策方案进行比较过程中，所有其他方面相同的情况之下，比较两个方案的不同之处，这样可以减少对于决策者的知识要求和理性要求。与此同时，由于有限理性决策模型采取满意标准，即只要决策方案符合期望标准就停止选择和比较，这样方案之间的选择和排序会影响最后决策的结果。正如马奇和西蒙所言，有限理性决策与理性决策的最大不同在于，“理性决策试图在大杆草棚中寻找最锋利的针，而有限理性决策则试图在大杆草棚中寻找能够用于缝纫的针”。〔16〕正因为这一原因，西蒙认为，通过对决策的经验观察，我们就可以发现，传统决策理论忽略了三个基本要素：第一个是建立议程的过程，该过程将决定在特定时刻将做出什么决策；第二个是再现问题或建构问题的过程，该过程选择需要关注的问题；第三个是产生备选方案的过程，该过程关注备选方案的产生和选择过程。〔17〕

此外，西蒙进一步指出，心理学在过去50 年的发展，使得我们可以建立一个理性选择模型，这一模型既能够融合人类行为的实际层面，又能够具有经济模型的清晰性。而要实现从“经济人”向“行政人”转变，必须具备两个条件：一是正如“經济人”追求效用最大化，“行政人”追求满意原则；二是“经济人”倾向于处理“真实世界”的所有复杂方面，“行政人”倾向于将复杂世界简单化，只找出一些重要变量和因果联系。

马奇等人进一步发展和细化了组织的有限理性决策模型，在有限理性的理念之下，提出了一系列的组织决策理论模型。〔18〕马奇对于在有限理性的理念之下进行组织决策研究的思想进行了回顾，其中主要思想包括：注意力分配与组织决策；利益冲突与组织决策；适应型规则与组织决策；模糊性与组织决策。而时间与注意分配的思想是所有其他思想的基础，他们认为在组织决策中，时间和注意力分配是稀缺资源，因此注意力的组织过程也是决策的过程，因此决策不是由对方案选择决定的，而是由与寻找方案相关的决策决定的。周雪光对有限理性理念下的组织决策模式进行了细分，列出了有限理性下组织决策的四种模式，包括：规章制度基础上的决策；组织决策的政治过程；组织决策的解释过程；组织决策过程启动的两个机制，即问题导向的决策过程和答案导向的决策过程。〔19〕

多属性效用理论正在发展成为一门行为经济学（Behavior economics）的子学科，实现心理学与经济学的有效融合，并且对公共政策产生了较大影响。公共政策的分析和研究需要吸收行为经济学研究成果，通过行为经济学研究来提升公共政策的制定、执行和评估科学性，目前经济学研究者主要聚焦于政策设计和政策效果评估。拉杰·切蒂从实际应用的视角（pragmatic perspective）讨论了行为经济学与公共政策之间关系，他认为行为经济学对于回答公共政策问题有很大启发和借鉴，他重点讨论了行为经济学在三个公共政策领域的应用，这三个政策领域涉及人类三项重要活动，即储蓄、工作和居住。〔20〕第一个政策领域是行为经济学能够提供新的政策工具影响行为，通过借鉴行为经济学中助推（nudges）研究，通过改变初始条件选择（default options）和将失去而不是获得作为激励框架（framing incentives as losses instead of gains）来改变人们的储蓄行为。例如一个公司通过推行加入保险的自动计划，但允许个人退出可以增加一个人参加保险的可能性。第二个政策领域是通过引入行为经济学模型对政策进行更好的预测，以劳动所得税收抵免政策（Earned Income Tax Credit，EITC）为例，讨论了不同地区有关EITC项目的参数信息对项目绩效的影响，研究结论显示人们拥有更多的信息更可能积极的反应，这些不同知识水平的差异构成了项目绩效评估的反事实（counterfactual）基础。第三个政策领域是探讨行为经济学对于政策的福利效应和最优政策设计提供新的洞见，主要是以房屋券补贴政策（housing voucher subsidies）为例，该政策是为了改变穷人的居住行为选择，在不增加居住成本的情况下，通过鼓励穷人迁入更好的小区来促进儿童成长，减少贫困的代际传递。对于最优政策设计而言，通过区分决策效用（decision utility）和体验效用（experienced utility），可以为政策制定者提供更好的政策建议。决策效用强调一个人选择中最大化的效用，而体验效用则是选择之后的实际福利，这两者并不是常常一致。而一旦决策效用与体验效用不一致时，行为经济学的政策建议就会不同于新古典经济学的政策建议。行为经济学的研究表明，当没有现在偏见（present bias）或无知（inattention）的情况之下，人们会采取不同的行为。这意味着，穷人在拥有更多的信息，避免行为偏见时，会改变居住行为，选择更好的小区生活，从而为儿童的未来发展奠定基础。

四、社会选择理论

成本收益分析和多属性效用理论都属于基数效用理论，社会选择则属于序数效用理论。前者意味着不同个人之间效用可以用数量进行直接比较，而后者认为不同效用之间不能够进行数量比较，只能够进行排序，排序意味着可以区分等级，不同等级之间不能够进行量化比较。社会选择的核心思想是如何将不同个人的偏好聚合成为社会偏好，实现社会福利最大化。社会选择的难题也是讨论是否有一种机制可以成功地将个人偏好聚合成为社会偏好。

对于社会选择悖论最早讨论是“投票循环”问题，也被称之为“孔多塞悖论”（Condorcets Paradox），当存在三个方案A、B和C进行两两比较时，可能会出现违反效用的“可传递”假设的现象。例如，甲、乙、丙三个人分别对A和B，B和C，以及A和C进行投票，形成了表3的结果。

从表4可以看出，C和B进行两两比较时，C获胜（甲和乙的选择偏好）；A和B进行两两比较时，B获胜（甲和丙的选择偏好）。根据效用传递性假设，C和A进行两两比较时，C应该获胜（C>B>A）。但是，在进行C和A实际投票两两比较时，A却获胜了（乙和丙的选择偏好），于是形成了C>B>A>C的现象。投票悖论意味着如果通过两两比较进行淘汰制，则选择的议程设置将发挥着重要作用（见表4）。

从表4可以看出，不同的两两比较方案会有不同结果。在这样的情况之下，议程控制对结果选择会有重要价值。当一个人想让C获胜时，可以选择A/B/C的议程设置。当一个人想B获胜时，就可以选择C/A/B的议程设置。而当一个人想让A获胜时，则可以选择B/C/A的议程设置。

对于研究者而言，一个重要的考虑因素是“投票悖论”是否具有普遍性。肯尼斯·谢普斯通对三个人三种方案情况之下，不同个人对于三个方案拥有不同偏好假设，此时三种方案一共可以形成6种排序，三个人会形成216种可能的选择结果。〔21〕在这216种结果中，符合“投票悖论”现象的有12种情况，占比为0.056。而一旦将投票人数和投票方案扩大，则产生“投票悖论”的概率越来越大。当投票人数为7，替代方案数量为5时，“投票悖论”的概率为21.5%。而当替代方案数量无穷大时，“投票悖论”的概率接近100%，这说明不能够通过简单多数来聚合个人偏好形成集体偏好。

“投票悖论”只是考虑了多数规则可能导致的投票循环问题，一旦使用其他规则是否能够解决这一难题呢？阿罗在一篇回忆不可能定理的起源中，他直接将该问题表述为：“我们寻找一种对所有替代方案的社会偏好排序，R，从这些社会偏好排序中，对任何给定的替代方案的社会选择，S，能够从偏好排序R中选择一个替代方案S中的最大要素。”〔22〕对此，阿罗给出了否定性答案，他从更为一般性角度讨论了投票悖论问题，提出了不可能定理。〔23〕在《社会选择与个人价值》一书中，他提出了一系列一般性条件，他认为这些一般性条件是任何聚合个人偏好都需要考虑的问题。一旦这些最少限定条件被提出，阿罗指出没有任何一种将个人偏好转化为集体偏好的方法可以满足上述最少限定条件。对此，阿罗在回忆不可能定理时，将主要限定条件概括为两个：“社会排序必须满足两个条件：在某种程度上，它必须反映个人的偏好排序；在从任何给定替代方案中进行社会选择，它必须仅仅使用个人关于这些替代方案排序的信息。”〔24〕肯尼斯·谢普斯通将阿罗不可能定理的限制条件更为清晰地总结为四个：

“条件U〔普遍性领域（Universal Domain）〕：对于群体中每一个成员都可以对任何偏好选择进行排序，这一排序符合理性假设，满足偏好的完全性和可传递性假设。

条件P（帕累托最优，或一致同意）：如果团体中每一个成员都认为方案J好于方案K，那么团体偏好也应该反映这一偏好情况，认为方案J好于方案K。

条件I（不相关方案的独立性）：如果偏好J和K对于团体中每一个成员而言有一种特定的关系，并且这种关系不变化，那么团体偏好中有关J和K的关系也不会发生变化。

条件D（非独裁）：不存在一个非常尊贵的个人能够将个人偏好转化为集体偏好。”〔25〕

在这四个条件中，条件P和条件I就是阿罗提出的两个必要条件。另外两个条件也很重要，条件U意味着不存在议程控制，所有的方案选择都是开放的，条件D意味着不存在独裁，每个人都拥有同等的表达偏好权利。在这四个条件之下，谢普斯通将阿罗不可能定理表述为：

“阿罗定理：不存在任何机制可以将理性个人偏好转化为一致的集体偏好，这一机制需要同时满足U，P，I和D这四个基本条件。”〔26〕

在阿罗看来，他所提出的这些条件是最低限度的条件。在这种情况之下，不存在一种将个人偏好转化为集体偏好的机制，那么任何超越最低限度条件的情况发生时，则更不可能存在一种将个人偏好转化为集体偏好的机制。阿罗不可能定理的推论表明，任何团体作出决策，要么存在着某种程度的集权，要么可能并不满足偏好可传递性假设，现实中团体决策是在权力集中和社会理性的平衡。这样，简单多数规则仅仅是将个人偏好聚合为团体偏好的一种方法和手段，这一方法在一定条件之下能够满足将个人偏好转化为集体偏好。

不过，围绕着阿罗不可能定理，产生了两种不同的反应。〔27〕一种反应是对阿罗的整个框架和条件进行详细审视，讨论是否可能对限制条件进行修改或放宽，以寻找逃脱不可能定理的路线。在这些讨论中，不同研究者分别对阿罗提出的四个条件进行论证，其中帕累托最优和非独裁性一般都保留，余下主要聚焦普遍领域和不相关方案的独立性是否可以放弃？如果放弃这些条件，是否能够避免不可能结果的出现。另一种反应是赞同阿罗的整个框架和条件，但是论证在所有偏好聚合規则都有缺陷的情况之下，是否存在一些规则比其他规则更好？达斯古普塔和马斯金就讨论了与其他投票规则相比，简单多数规则（simple majority rules）所具有的稳健性。〔28〕

社会选择理论对于公共政策研究而言具有十分重要的启示和借鉴意义。公共政策是一个选择过程，是一个寻找方案的过程。对于公共政策而言，一个核心问题是：公共政策能够满足所有人的需求吗？根据帕累托最优理论，如果所有的人都认为一项公共政策能够满足部分人员需求，而不会给其他人带来损失，那么这一公共政策就符合帕累托标准，能够给所有人带来收益。现实中公共政策选择却是一部分人获益，一部分人受损，很难满足帕累托标准。为此，经济学家提出了希克斯补偿标准，强调一项公共政策满足两项条件，仍然是对社会有益的：一是公共政策会造成更多的赢家而不是输家；二是在对输家进行补偿之后，仍然会有收益。这些条件是建立在基数效用理论基础之上，阿罗正是挑战了这一理论，提出了将个人偏好转化为社会偏好的问题。阿罗的研究对于公共政策而言是失望的，它意味着不可能找到一个公共政策能够满足所有人偏好，公共政策总是存在赢家和输家，会给一部分人员带来受益，给另一部分人带来损失，这也是很多研究者从政治途径研究公共政策的原因所在。

五、公共选择理论

公共选择理论是将理性选择理论应用于政治学的集中展现，对政策过程的决策途径具有重要的影响。从更广义的范围看，社会选择理论也属于公共选择理论的范畴。不过，由于社会选择理论只是关注将个人偏好聚合成为社会偏好，并且以投票作为主要研究对象，这使得社会选择理论成为公共选择理论具有特色的一个理论流派。缪勒将公共选择理论定义为：“公共选择理论可以被界定为是对非市场决策的经济学研究，或者可以把它简单地定义为应用经济学去研究政治学。公共选择理论的主题与政治学是一样的：国家理论、投票规则、投票人行为、政党政治、官僚制，等等。但是，公共选择理论的方法论是经济学的。公共选择理论和经济学类似，其基本假定是，人是自我的，理性的，效用最大化的。”〔29〕从缪勒的定义可以看出，公共选择理论是经济学与政治学的融合，又被称之为新政治经济学。

正是因为公共选择理论被广泛应用于政治学各个领域之中，这也使得公共选择理论成为一个包含广泛内容的标签。对此，作为公共选择理论的鼻祖布坎南有清晰的认识，他认为公共选择理论更多是一个研究项目，而不是一个学科或者子学科。作为一个研究项目，公共选择理论共享一些核心特征，他将这些特征概括为三个方面：方法论个人主义、理性选择和作为交易的政治。〔30〕〔31〕文森特·奥斯特罗姆和埃莉诺·奥斯特罗姆在将公共选择理论引入公共行政领域时，将公共选择理论的核心构成要件也概括为三个，他们指出：“人的模型、公共物品或服务的属性和决策结构构成公共选择理论的主要分析变量。”〔32〕由此可见，公共选择理论更多提供了一个分析问题的理论视角和方法，而要得到具体研究结论则需要将公共选择理论与具体领域相结合。目前，公共选择理论已经形成了很多具体的理论，考虑到与政策过程的相关性，下面将重点介绍中间选民定理（median voter model）、一致同意理论（rules of unanimity）和宪法政治经济学理论（constitutional political economics）。

中间选民定理是为了重新拯救简单多数规则，讨论简单多数规则作为集体选择机制的合法性。邓肯·布莱克发现，如果集体选择的替代方案能够按照单一维度进行排序，并且具备单峰偏好（single-peakedness）特征，那么投票循环的麻烦就不会出现。〔33〕〔34〕在这样的情景之下，与其他替代方案相比，中间投票者的方案将会成为大多数所期待的方案。肯尼斯·谢普斯通对单峰偏好的特点进行了定义，他指出：“团体成员的偏好是单峰意味着：被考虑的替代方案能够在线中以点表示，每一个替代方案的效用函数对于这些替代方案而言在线中某一点上有一个最大值，并且从最大值两边开始以斜线方式呈现。”〔35〕布莱克的中间选民定理有三个基本假设，即团体中成员必须是奇数，所有人都要参与投票，每一个人都要进行真实意思表达。唐斯最早将多数规则的空间模型应用于两党政治竞争中，他的核心问题是：为什么两党在意识形态方面会趋同？〔36〕他通过多数规则的空间模型证明，中间选民会决定政党的政策选择，这使得两党会提供有利于中间选民的政策菜单。简而言之，中间选民的投票会形成一个均衡。所有这些讨论都是以单一维度为基础，一旦涉及多个维度，简单多数投票的循环问题就可能出现。

布坎南通过引入维克塞尔（Wicksell）的一致同意理论挑战了简单多数规则，并且将作为交易的政治引入政治学研究中，强调寻找有利于公民与政府之间交易合法性的规则。〔37〕他认为，简单多数规则是以将群体中成员分为多数和少数为代价，这必然导致一部分人员对另一部分人员的剥夺，简单多数规则既不具有效率，也不能够产生公正，它不符合经济学中帕累托最优原则。为了保证政府与公民之间交易的最基本公平，就必须将投票规则修改为接近一致同意的规则。当然，一旦接近一致同意原则，这可能使得共同体达不成任何协议。不过，一致同意规则仍然是一个重要的比较和评价准则。为此，布坎南和图洛克在《同意的计算》一书中，将集体决策过程划分为两个层次，提出了区分决策规则的选择和决策规则之下的选择，并发展了分析立宪选择（constitutional choice）的分析框架，认为决策规则的选择是对决策成本和外部成本权衡取舍的结果，这是他们对公共选择理论的重大洞见。在他们看来，不同的选择对应不同政治，规则之下选择对应“日常政治”和“利益政治”，规则本身的选择对应“宪政政治”和“原则政治”。〔38〕〔39〕

布坎南在后期更是将研究聚焦于规则，使之区别于传统的公共选择理论，为此，他还专门提出了一个新的名词宪法经济学（constitutional economics）或宪法政治经济学（constitutional political economy）来描述这一他认为有前途的研究领域，并且认为可以根据研究方法不同，进一步将之区分为规范宪法政治经济学和实证宪法政治经济学。斯蒂凡·沃伊特曾经对这一研究领域进行了文献回顾，讨论了实证宪法政治经济学的前沿进展。〔40〕〔41〕他对布坎南提出的规范宪法政治经济学和实证宪法政治经济学进行了详细阐述，他认为：规范宪法政治经济学主要是论证现有立宪规则的合法性，讨论理性的个人是否会选择约束自身的规则，社会契约理论基本属于这一范畴；实证宪法政治经济学则讨论两个层面的问题，一是从经济绩效的角度讨论立宪选择的效果，二是讨论立宪规则的产生和变更问题。在这一分类框架之下，他重点讨论了实证宪法政治学中自变量和因变量定义和测量问题，对宪法的经济效果这一重要研究领域进行了总结和回顾，并将这一领域研究主要归结为选举制度（electoral systems）和政府形式（forms of government），并按照选择规则（electoral rules）、横向分权（horizontal separation of powers）、纵向分权（vertical separation of powers）、直接民主或间接民主（direct versus representative democracy）等进行了分别阐述。不过，他认为将宪法规则“内生化”（endogenizing constitutions）仍然是一个值得深入研究而进展比较缓慢的研究项目，也是宪法政治经济学下一步的研究重点。此外，斯蒂凡·沃伊特还认为在对规则（rules）的研究方面，宪法政治经济学可以作為新制度经济学（new institutional economics， NIE）的子领域，制度经济学一般的关注制度经济绩效与制度变迁问题，而宪法政治经济学则主要关注宪法规则，后者对此关注不多，因此两者之间可以相互借鉴、相互学习和共同发展。

将公共选择理论与政策过程理论进行有机联系，这仍然是一个值得开发的领域。政策过程可以看作布坎南所谓的“日常政治”，它是在决策规则之下的政策选择。目前，很多研究者更多讨论“日常政治”视野之下的政策过程，仍然缺乏对政策过程的决策规则的关注，缺乏将“宪法政治”与政策过程理论进行结合，探讨产生良好政策的规则基础。

六、博弈论

前面的讨论都是以单个人决策为基础，没有考虑多个人之间决策互动问题。即便社会选择理论和公共选择理论，仍然是将团体作为一个决策单位，考虑团体选择（group choice）问题。博弈论则是讨论多个主体之间的决策问题，它强调决策结果受到每一个参与决策的人员影响，这不是集体选择（collective choice）问题，而是集体行动（collective action）问题。博弈论假定不能提前施加操作，必须回到如何刻画多个行动者的决策问题。对于博弈论而言，个人依旧在行动，并且像个人一样决策。从某种程度上看，博弈论是最极端的理性模型，它将复杂现实简化为抽象博弈模型。目前有学者开始尝试使用博弈模型来研究公共政策，使用博弈论来描述、解释和规范复杂的政策现象。〔42〕这说明，博弈论可以为政策研究提供深刻的洞见，有利于为政策对话提供有用信息。

博弈论可以根据参与者是否形成团体而区分为非合作博弈论（non-cooperative n person games）和合作博弈论（cooperative n person games）。对于非合作博弈而言，其核心假设是合约具有不可执行性，没有合约的情况之下讨论每一个行动者的最优策略。对于合作博弈而言，它强调承诺、协议和威胁具有可执行性，讨论在有合约的情况之下，不同行动者之间成本和收益的分配，以及如何促进合约和合作的产生。克雷普斯指出：“博弈论包括两个主要部分：合作博弈理论与非合作博弈理论。二者的基本差别在于，非合作博弈理论的分析单位是参与博弈理论的参与者，合作博弈理论的分析单位是群体，更准确地说是一种联合体。参与非合作博弈的参与者利用一切可能的机会，最大限度地獲取个人利益。……合作博弈理论讨论群体利益怎么实现，而不涉及参与者的联合怎样影响博弈的结局。”〔43〕

非合作博弈有两种表现形式，一种是策略型博弈，另一种是展开型博弈。对于策略型博弈而言，它包含着三个组成部分：“一批参与者（或称局中人）；每个参与者可能采取的各种策略；对于参与者采取策略的不同组合存在着相应的报酬组合。”〔44〕博弈论研究的一个重要内容是求解，这是对模型的预测。非合作博弈理论有两种模型求解技术，一种是优势分析，另一种是均衡分析。优势分析强调无论对方选择何种策略，自己选择该策略都具有优势，此时该策略被称之为占优策略。均衡分析是一种策略组合，每个参与者各自选择策略，一旦实现纳什均衡，任何参与者都不再企图改变策略。

合作博弈的问题不是每一个参与者如何采取什么样的最优策略，而是假定所有参与者采取一个共同的、合作的策略，核心问题是成本和收益如何在不同参与者之间分配？勒加诺认为，合作博弈需要讨论一系列的问题：“只有他或她不能够独立做得更好，参与者才将合作；我们需要讨论每一个参与者应该从博弈获得多少好处；也有这样参与者通过共谋而不合作的现象；只有当最后的配置能够对所有人好或公平，强的合作纽带才能够发生。”〔45〕很显然，在合作博弈中，参与者比非合作博弈中拥有更多的选择。合作博弈更多是一个联盟的过程，以及联盟中收益分享和成本分担问题。

博弈论对于理解政策过程具有重要的作用。一方面，可以通过博弈论率论证某些已经存在的政策选择，尤其是对一些不变化的政策可以理解为博弈中均衡状态。例如，为什么很多国家都对农业实施补贴，对于这一政策可以从博弈论的角度给出解释，认为农民团体形成一个利益集团在与其他群体博弈中处于优势位置。另一方面，可以通过博弈论来对一些政策选择、政策执行和政策效果进行预测。通过了解各方的策略，可以更好预测在一定情景之下，什么样的政策可能会被选择。对于已经实施的政策，也可以通过博弈论预测执行情况和效果。目前看来，博弈论与政策过程之间结合还需要加强，尤其是对政策过程中动态过程的模拟，博弈论还有很大的应用空间。

七、理性的个人能够产生合宜的公共政策吗？

漫长的理性选择理论之旅为公共政策的研究提供了新的视角，它可以帮助我们解释不同政策得以产生的动因，探究复杂政策世界中的模式。一旦我们从实证研究走向规范研究，问题便转化为：理性的个人能够产生合宜的公共政策吗？或者说，如果我们期待公共政策是符合公共利益的，什么样的政策过程是值得期待的？奥尔森的集体行动理论告诉我们，理性的个人有可能会有搭便车的倾向，每个追求理性的个人常常会导致集体不行动，这可以解释为什么对很多人不利的公共政策却能够长期存在。〔46〕埃莉诺·奥斯特罗姆通过对公共池塘资源的大量实证研究表明，尽管在公共领域常常存在公地悲剧，但是理性的个人也可能通过制度渐成来解决他们面临的集体选择难题〔47〕，这也可以解释为什么很多人仍然可能通过自身的努力来推动公共政策变革，使得公共政策能够更好地实现公共利益。由此可见，在一定的情景之下，理性的个人仍然可能产生合宜的公共政策，“衰退的公共政策”（Degenerative Public Policy）并非是人类的宿命。而合宜的公共政策得以产生，一方面取决于我们能否设计出好的公共政策，另一方面取决于政策过程是否有良好的土壤生产出这些好的公共政策。对于这两个方面的问题，理性选择理论都可以有自己的洞见。

经济学中的理性选择理论可以为理性的政策设计提供理论基础，它有助于公共政策更加激励兼容。早期的经济学理论对于公共政策的贡献主要是成本收益分析，它可以提供一套对政策选择和政策效果评估的工具。一旦一项公共政策不符合经济逻辑，就不具有经济可行性。所有的政策选择和政策评估都需要接受经济可行性检验，这样才能够得到其合法性。随着行为经济学理论的产生，经济学对公共政策的贡献开始从选择走向执行，它不仅强调要选择合宜的政策，而且还重视什么样的政策能够被成功地执行。行为经济学的一些发现，可以起到对公共政策“助推”作用，通过提前思考个人可能的策略行为以使得激励兼容，从而避免良好政策不能够实现预期效果的悲剧。当然，经济学中主流理论对于政策研究的思考，都是将自己定位为“牙医”去帮助诊断问题和提出解决方案，而将政策制定者设想为仁慈的君主。正是对政策制定者仁慈假设的放松，使得政治学中理性选择理论得以产生，关注公共政策中的“结构”问题，结构改革的选项被提出。

政治学中的理性选择理论则为合宜的公共政策产生提供了结构改革的视角，它试图寻找良好公共政策产生的制度基础。公共选择理论是政治学中的理性选择理论的指称，而作为公共选择理论最新发展的宪法政治经济学其结构化视野更加清晰。公共选择理论认为政策制定者和每个个人一样，可能追求公共利益，也可能追求私人利益，要实现“化私为公”，就需要“结构性改革”，通过设计一套合理的公共政策产生的结构，让对所有民众有利的公共政策得以产生。例如，布坎南和图洛克在分析多数投票规则时，就提出这种规则可能产生“互投赞成票”的现象，各种分配性公共政策成为西方国家的常态，从而使得预算赤字得以产生。要改变这一现象，就需要从改变公共政策产生的“结构”出发，尤其是要对政策过程中“制度结构”进行根本变革，让每一个人的利益得到更好表达，避免少数人垄断政策过程。当然，更多的结构也意味着更多的决策成本，更少的外部成本，因此决策成本和外部成本之间需要有一个适当的平衡。

讓理性成为人类之友，让推理发挥更积极的作用，通过制度变革使得理性的个人能够通过策略性互动产生合宜的公共政策，这直接关系到人类文明的存续。良好的公共政策是重要的，而产生这一公共政策的土壤更重要。政策过程的理性选择理论仍然大有所为，它可以帮助我们让理性的个人促进而不是阻碍公共利益的生产。

〔参考文献〕

〔1〕〔23〕Arrow， K. J. （2012）. Social choice and individual values （Vol. 12）. Yale university press.

〔2〕李文钊.政策过程的决策途径：理论基础、演进过程与未来展望〔J〕. 甘肃行政学院学报，2017，（6）.

〔3〕Rowley， C. K.， & Schneider， F. G. （Eds.）. （2008）. Readings in public choice and constitutional political economy. New York， NY： Springer.

〔4〕〔21〕〔25〕〔26〕〔35〕Shepsle， Kenneth A.（2010）. Analyzing politics： rationality， behavior， and institutions. New York： W.W.Norton.p69，72，92.

〔5〕Munger， M. C.， & Munger， K. M. （2015）. Choosing in Groups. Cambridge University Press.

〔6〕Cairney， P. （2011）. Understanding public policy： theories and issues. Palgrave Macmillan.p133.

〔7〕〔12〕〔45〕Lejano， R. P. （2006）. Frameworks for policy analysis： Merging text and context. Routledge.p26，27，75.

〔8〕〔9〕〔10〕Munger， M. C. （2000）. Analyzing policy： Choices， conflicts， and practices. WW Norton.p353，9-14，13.

〔11〕戴维·L·韦默，艾丹·R·瓦伊宁. 公共政策分析理论与实践〔M〕. 北京：中国人民大学出版社，2013.

〔13〕Kahneman， D.， & Tversky， A. （1979）. Prospect theory： an analysis of decision under risk. Econometrica， 47（2）， 263-291.

〔14〕丹尼尔·卡尼曼. 思考，快与慢〔M〕. 北京：中信出版社，2012.

〔15〕〔17〕Simon， H. A. （1997）. Administrative Behavior. Simon and Schuster.p87，122.

〔16〕March， J. G.， & Simon， H. A. （1993）. Organizations. NY： Wiley， New York.p162.

〔18〕March， J. G. Primer on decision making： How decisions happen. Simon and Schuster，1994.

〔19〕周雪光.组织社会学十讲〔M〕. 北京：社会科学文献出版社，2003.

〔20〕Chetty， R. （2015）. Behavioral economics and public policy： A pragmatic perspective. American Economic Review， 105（5）， 1-33.

〔22〕〔24〕Arrow， K. J. （2014）. The origins of the impossibility theorem. In Maskin， E.， & Sen， A. The Arrow Impossibility Theorem. Columbia University Press.p144，144.

〔27〕Pattanaik， Prasanta K. （2014）. In Maskin， E.， & Sen， A. The Arrow Impossibility Theorem. Columbia University Press.

〔28〕Dasgupta， P.， & Maskin， E. （2008）. On the robustness of majority rule. Journal of the European Economic Association， 6（5）， 949-973.

〔29〕丹尼斯·C.缪勒.公共选择理论〔M〕. 北京：中国社会科学出版社，2010.1-2.

〔30〕〔37〕Buchanan， J. M. （2003）. Public choice： The origins and development of a research program. Champions of Freedom， 31， 13-32.

〔31〕詹姆斯·M.布坎南，戈登·图洛克.同意的计算〔M〕. 上海：上海人民出版社，2014.

〔32〕Ostrom， V.， & Ostrom， E. （1971）. Public choice： A different approach to the study of public administration. Public Administration Review， 31（2）， 203-216.

〔33〕Black， Duncan.（1948）. On the rationale of group decision making. Journal of Political Economy 56： 23–34.

〔34〕Black， Duncan.（1958）. The Theory of Committees and Elections. Cambridge： Cambridge University Press.

〔36〕Downs， A. （1957）. An Economic Theory of Democracy. NewYork： HarperandBros.

〔38〕詹姆斯·M·布坎南，罗杰·D·康格尔顿.原则政治，而非利益政治——通向非歧视性民主〔M〕. 张定淮，何志平译.北京：中国社会科学文献出版社，2004.

〔39〕杰佛瑞·布倫南，詹姆斯·M·布坎南.宪政经济学〔M〕. 冯克利，等译.北京：中国社会科学出版社，2004.

〔40〕Voigt， S.，（1997）， “Positive constitutional economics—a survey”， Public Choice， Vol.90， 11–53.

〔41〕Voigt， S.，（2007）， “Positive constitutional economics II—a survey of recent developments.”， Public Choice， Public Choice， Vol.146： 205–256.

〔42〕Scharpf， F. W. （1997）. Games real actors play： Actor-centered institutionalism in policy research. Westview Press.pp53-59.

〔43〕〔44〕戴维·M.克雷普斯.博弈论与经济模型〔M〕. 北京：商务印书馆，2006.11-12.

〔46〕Olson， M. （1965）. Logic of collective action： Public goods and the theory of groups （Harvard economic studies. v. 124）. Harvard University Press.

〔47〕Ostrom， E. （1990）. Governing the Commons. Cambridge： Cambridge University Press.

【责任编辑：朱凤霞】