重考量刑公正与量刑差异
熊谋林+赵勇+程乙峰
内容摘要:主流观点认为中国普遍存在量刑差异,但该结论实证依据不足。本文借助于德阳市5个法院的1039个样本,检测盗窃、抢劫、故意伤害罪的量刑情况。研究按四组配对比较后发现,三组法院量刑均衡。盗抢罪量刑受数额、前科、审理程序、自白、律师参与、从严处罚等影响,故意伤害罪因伤害程度、受害人个数、赔偿等有别。2010年量刑意见有助于规范量刑,但法官更倾向于从严处罚。中国未来的量刑改革,还需具体规定如何适用从宽从严集合情节。
关键词:量刑差异;不显著;影响因子
引言: 未被验证的量刑差异与规范改革
量刑公正,是中国刑事法学界普遍关心的问题,为此掀起了长达20年的量刑规范化讨论。这场探讨的主题是:中国刑事司法实践中存在严重量刑差异,应采取多种措施控制。 受学术研究的影响,中国各地刑事司法机关陆续出台一些量刑规范化政策,并曾经呼吁开展电脑量刑等智能化操作模式。这些举措的背景反映出法官量刑具有较大随意性,量刑结果存在失调。 在此趋势下,中国最高司法机关采纳了“量刑规范化”这个理论和实务界总结出来的经验,陆续细化不同犯罪等级的量刑幅度,以求最大化地做到量刑均衡。尤其是,最高人民法院2010年出台《人民法院量刑指导意见(试行)》,以求“实现量刑均衡,维护司法公正”。 以此为基础,上海、北京、四川等各省级司法机关陆续制定具体的量刑指导细则,从而在本地司法管辖范围内规范量刑。
学术、司法、立法、实务互动,这一系列现象似乎肯定了中国刑事司法中广泛存在着量刑差异。学者对“是否存在量刑差异”的个案考察结果,也进一步支持了“量刑存在失衡”这个命题。 然而,与海量的量刑公正和量刑均衡理论研究相比,中国目前尚没有刑事司法量刑活动的经验研究揭示出这个问题的真实性。 这就意味着,在中国刑事审判实践中存在严重量刑差异的命题尚没有得到数据验证。
电脑量刑改革的否定,已成为中国刑事量刑规范化进程中尴尬的一幕。然而,如果不能冷静客观地对待量刑改革和量刑公正这个话题,中国刑事量刑改革的初衷可能也将难以实现。鉴于学术界对量刑公正众说纷纭,且缺少必要的数据支持,我们开展了本次实证研究。这个针对量刑失衡问题的实证研究,有两个基本的假设:一,中国刑事审判实践中,不存在普遍意义的量刑差异;二,中国的刑事审判实践中,存在着严重的量刑差异。我们认为,司法改革需要一个客观的检验过程,才能反映中国刑事司法的真实状况。否则,歇斯底里地呼吁中国刑事量刑改革毫无意义。因此,如果出现第二种结果,那么未来的司法改革应当找准造成量刑差异的因素,制定科学的刑事政策。如果是第一种结果,中国刑事审判中的有益经验就应当继续发扬。
一、量刑公正与量刑均衡:被渲染的真命题?
中国学者对量刑公正和量刑均衡的研究,成果颇丰!沈德咏从刑罚文明史角度,认为人类刑法文明史,就是一部为实现刑罚目的而不断追求量刑公正的历史。 基于这个崇高的价值追求,学术界展开了深入的探讨。周光权等人从量刑裁判必须考虑的社会危害性因素方面,结合量刑情节论证了确立量刑基准的理由。 赵廷光与季卫东等围绕电脑量刑的准确性和科学性,以及中国当下是否应当开展电脑量刑展开了深入的辩论。 谢鹏程等基于规范量刑自由裁量权,从量刑程序的分离等多角度论证了促进量刑均衡的刑事诉讼程序改革措施。 陈瑞华与左卫民等围绕是否从检察机关开展量刑建议活动,作为规范法官自由裁量权、强化量刑程序的对抗性作了辩论。 林维、熊谋林从量刑情节裁判原则过于抽象、量刑幅度角度过大,论证了规范量刑的适用法则。
(一)量刑差异及其表现
纵观近20年的研究成果,几乎所有学者一致认为中国的量刑存在普遍差异。先前的研究显示,中国的量刑差异主要表现为如下两个方面:(1)同案不同判, 同罪不同罚; (2)轻罪重判, 重罪轻判。 在列举这些量刑差异的理由时,一些研究成果中举出不少案例来具体阐释说明。这些案例所反映出的量刑差异大致可分成如下几类:
第一类,同一地区法院对不同犯罪人的量刑出现较大差异。赵廷光的代表性案例显示,某区法院对四起盗窃犯罪的判决如下:判决一: 盗窃财物共计160元,有期徒刑6年(判决做出日期为6月12日);判决二:盗窃财物共计1600元,有期徒刑6个月(判决做出日期为同年6月16日);判决三:盗窃财物共计9800元(多次),有期徒刑2年,罚金300元;判决四:盗窃财物共计980元(一次),有期徒刑2年,罚金2300元。
第二类,不同地区对同一类型的犯罪量刑出现较大差异。陈海平的案例显示,2000年江西原副省长胡长清因受贿500多万元被判死刑。但此后受贿900多万元的深圳海关原关长赵玉存被判无期徒刑。 山东省某中院判了一个案子,4名被告人在半年的时间里通过一些技术手段,总共窃电价值31. 6万余元,主犯判了无期徒刑。同期,在网上炒得很热的深圳中院一个盗窃奔驰轿车的案子,一个犯罪团伙在半年时间内盗窃7辆奔驰轿车,价值700余万元,销赃得款20余万元。两案发案时间大体一致,但后案的主犯仅判15年。 陈宏伟的案例也显示,2006年上海妻子杀夫案,行为人被判14年有期徒刑,2005年包头妻子杀夫案,行为人被判处有期徒刑3年,缓刑5年。
第三类,犯罪人籍贯和户口性质的不同被判处不同量刑。非京籍人被判处缓刑的比例低于京籍人被判处缓刑的比例,采取取保候审强制措施的被告人被判处缓刑的比例远远高于被逮捕而被判处缓刑的比例,因过失犯罪被判处缓刑的被告人比例远远高于故意犯罪被判处缓刑的被告人比例。
第四类,同一犯罪人在不同审判程序被判处不同的刑期。赵廷光的案例显示,福建周宁县陈长春强奸和妨碍作证案合并判处有期徒刑3年,二审改判有期徒刑12年;山西泽州周蜡成一审7项罪名合并执行20年,二审山西高级人民法院改判为有期徒刑3年。
上述案例,的确说明了中国刑事审判在个案中存在量刑差异。然而,我们的文献考察发现,大量有关建构中国量刑公正和量刑均衡制度、避免量刑差异的讨论,除了以量刑结果展示量刑差异外,并没有对案例的具体情况作出仔细考察。即使少有的案例研究中,学者们也习惯将由个别案例引发出的量刑差异结论,推广至中国刑事司法审判实践。
(二)量刑差异及其原因
学者们常用的研究方法是用“典型案例”和“代表性案例”代表一般现象,以个别案例作论据进行量刑差异的论证和分析。因此,梳理这些案件和研究,不难发现中国存在令人担忧的量刑差异,就其产生的原因,大致可以分成如下几类:
(1)量刑幅度过大,法官自由裁量权难以限制。陈瑞华等认为,法官的自由裁量权过大是导致量刑差异的原因之一, 法官过度以自己的刑罚价值观影响量刑,导致量刑结论因缺乏规则上的自治而影响其稳定性。 周光权等认为,法定刑幅度过大是造成量刑失衡的先天原因,比如10年以上的法定刑中,往往又包括无期徒刑和死刑。这种法定刑量刑幅度跨度大、空间大、刑种多,实践中一旦出现犯罪人具有减轻处罚的情节时,判决结果就有可能超出人们对减轻处罚的心理承受力。 郭志远在分析中国法官的量刑时指出,中国现行刑法中法定刑相差达到或者超过5年的条款多达200多个,占整个刑罚的40%;加上有些规定比较模糊,不同的法官理解也不一致,造成实践中量刑不公的现象。
(2)法官忽略量刑程序的科学性,随意裁判导致量刑差异出现。例如,陈瑞华等的研究指出,法官过分重视定罪程序,轻视量刑程序。 量刑活动自身特点的制约,即法律是抽象的,而刑事案件千差万别,立法语言的开放性与刑事审判法官需要自由裁量权的特点决定了量刑活动不可能成为一种按图索骥的机械活动,在诸多可变因素的相互作用下就使得量刑失衡成为可能。
(3)量刑差异与量刑均衡的研究较少,司法认识不足。研究指出,新中国刑法学自发展以来,在最近十年才开始普遍关注量刑公正问题,对于刑罚设置、配置和效果等方面的研究成果尚显缺乏,使得司法实践中不规范行为的出现难以得到有效的遏制。
(4)法外因素对量刑公正活动的影响。研究指出,传媒的误导性报道和追求新闻效果的夸张性介绍不仅加剧了被害方的复仇情绪,也给办案机关造成较大舆论压力,法官往往屈服于舆论激起的民愤,导致量刑差异。 由于司法机关在财政、人事上受制于地方政府,地方行政的干预也容易导致量刑差异。 法官行使审判权是在具体的社会环境下进行的,许多社会因素因与案件有关而连接成各种关系网,说情、请托就在所难免,从而影响司法公正。
上述论证可谓非常有说服力,毕竟这是多年来达成的“学术共识”前提下的解析。但这些分析很难在大范围内印证,而且这种以局部代表整体的假设,通常忽略极端个案本身的特征。例如,学者用以分析量刑差异存在的“许霆案”,即使在学术界对定罪与否尚存在较大争论,更别说实务界的量刑。类似个案,甚至不能说明大量的普通案件存在“无期”和“五年”的极端性偏差。我们也注意到,学术界常以山东淄川区法院推行量刑化改革后,所实现的“零上诉、零抗诉”论证量刑指导意见对于缩小量刑差异的关键作用。然而,目前并没有研究成果用客观事实揭示出,山东淄川法院改革前后的量刑差异是否真的有所减少。因此,中国司法实践中是否存在法律无法控制的量刑差异,还是一个未知命题。
二、命题检测:量刑差异能否检验和解释吗?
与裁判量刑活动的过程一样,量刑差异的检测也错综复杂。正如季卫东指出,法官裁判刑罚需考虑法官裁判的法律内事实,而且需要对个案考虑一些特殊性,如政策、利益平衡、受害人需求、预防等各种因素。 事实上,仅从直觉上判断,法官裁量刑罚的过程的确错综复杂。这也就决定了,司法裁判活动的科学性,以及量刑的精准化很难被检测。可能正因为如此,这也是中国刑事法学界并不开展量刑差异和量刑公正检验的原因。然而,我们通过对英文文献的考察发现,量刑差异的检测和定量研究并非不可能,并且已形成了一整套解释量刑差异的理论。因此,对英美国家已经成型的研究量刑差异和量刑公正的方法进行梳理,有助于对中国的量刑差异问题进行尝试性研究。
(一)关于量刑差异能否被检测的问题
在量刑差异的存在性检测上,霍格斯早期从心理学角度指出,量刑程序非常复杂,法官在决定监禁和量刑长度时所考虑的因素较多,量刑差异的客观真实性变得难以信服。 因此,奥斯汀和威廉姆斯后来的研究指出,受量刑情节、量刑客观情况的影响,量刑差异是否存在的检测,以及量刑差异的合法性程度的精确检验变得不可能。 上述二位的研究,的确反映了量刑程序的复杂性,然而这仅是量化研究普遍开展以前的早期结论。一些新近的定量研究提出了新的证据,并由此提出了多种解决和解释量刑差异检测的经典理论。
焦点理论(Focal Concern Theory)提出假设,影响量刑的因素真的不可探测吗? 是否每个量刑因素都要关心呢?回答是否定的。量刑过程中通常有三个关注的内容:(1)罪犯的谴责性或罪责评估;(2)通过剥夺犯罪人的犯罪能力,或者威吓潜在犯罪人保护社会;(3)量刑决定产生的实际结果、社会成本。 阿尔伯尼特基于降低不确定性(Uncertainty Avoidance)的理论,认为真实的量刑决定程序很少达到完全充分掌握案件信息的客观精确程度,因此,在信息不完全的情况之下,减少这种不确定性的方法是借助于习惯和社会结构的理性。法官一般通过开发模式化的反应机制去尝试管理不确定性。这是法官基于自己处理程序中受影响的判断机制,法官们通常基于日积月累的模式,如种族、性别、早期犯罪的量刑结果等去预测未来犯罪活动。因此,在刑事司法系统中判处刑罚,与其他自由裁量权的处理结果一样,是自我满意和简化偶然假设,从而努力实现理性的结果。
与此相关的是霍金斯的经验观察理论(Perceptual Shorthand Theory)。该理论认为,法官的确不可能充分掌握刑事案件及被告的所有信息,从而精确地决定量刑期限。然而,在量刑信息不可能全面掌握的情况下,法官倾向于用多年的经验(stereotype)观察,结合犯罪的危害性和犯罪人再犯倾向,作为量刑的基准(benchmark)决定量刑的长度。
以上理论围绕三个方面讨论:量刑是否需要全面考察被告人的信息,法官是否需要严格按照量刑指南对被告人的量刑做出精确决定,是否允许法官以个人经验结合被告人的人身特性在自由裁量权范围内自由裁量。基于这个立场,法官量刑的个体差异化有其合理原因,毕竟法官的经验判断对不同被告人的决定不一致。由于法官量刑是基于长期经验和以往的习惯作判断,这个立场也成为法官量刑稳定合理性的解释原因。 这从另一个角度解释了,表象或个案所代表的量刑差异,可能在考虑整个案情后并不存在。不过,这个主观评价过程,还是有可能出现不同法官对被告作出不同评判,从而出现量刑差异。 由此,量刑是否真的存在差异,即使有争论也并不奇怪,毕竟可以有不同的解释机制和价值判断标准。
(二)量刑差异的存在性及其解释
从文献来看,即使就美国联邦和地区之间,及其联邦、州内部是否存在量刑差异,结论也并不一致。考特的研究指出,毒品运输犯罪在美国联邦不同司法区以及同一司法区法庭间量刑存在差异。 奥斯汀的研究指出,法庭所在的城乡位置也影响量刑结果从而出现差异,以城市人口居多的法庭处罚时更考虑法律内因素,而主要以乡村位置聚居为主的法庭则受法律外因素影响较大。 吴对美国联邦不同司法区的量刑差异进行研究后,指出不同法庭之间的量刑存在差异。 不过,这些研究所提出的量刑差异,在进一步研究中被解释。安德森和斯伯恩的研究指出,联邦法官虽然表面上量刑有差异,但是这些差异是因为案件类别和犯罪的严重性所导致,他们因此认为联邦量刑并没有失衡,而是与联邦量刑指南趋于一致。
值得探讨的是,美国联邦量刑指南在实践中的作用。文献显示,美国至少有15个州和联邦司法系统已经制定了量刑指南。然而,学术界对美国的量刑指南评价并不高。研究指出,与先前的强制量刑不同的是,这些量刑指南虽然允许法官基于个案的考虑而裁判合理的刑期,但由此造成新的量刑差异。 克莱默和乌尔莫指出,1982年宾夕法尼亚州量刑委员会制定的量刑指南,通过区分重罪和轻罪的违法轻重程度,结合刑事犯罪记录情况,建立多个量刑梯度,并且赋予法官针对个案的自由裁量权,还允许法官在指南幅度下量刑。 斯蒂次和卡博瑞恩在评价量刑指南的作用时指出,联邦量刑指南虽然控制了量刑差异,但并没有消除基于自由裁量权而出现的量刑差异。 即使有量刑幅度限制,如法官在根据案件的特殊情况,判断出联邦量刑指南可能会判得过重或过轻时,可能采取变通措施。
以上信息,反映出学术界对量刑差异存在性探讨的客观认识。研究还指出,不同地区法院之间的量刑存在一定的差异,这与地区文化和法官有关。在进一步探讨法院量刑之间的差异时,犯罪学者在法院间和法官个人内部做了不同的研究。法院间的量刑差异研究指出,不同州以及本州内部的法院之间有量刑差异。 对于法院之间的差异,安德森等认为,不同的社区背景和公诉人的量刑动议实施情况解释了这些差异。 约翰逊的研究指出,法官和不同法庭的社会环境共同决定了量刑差异。 乌摩尔的定性研究进一步指出,不同巡回法院之间在辩诉交易政策和实践,审判后处罚的刑种和刑度,以及量刑严重性的差异决定了不同地区以及当地法庭社区对量刑指南的理解和解释差异,从而导致了量刑的多种结果。 狄克逊等的研究在解释量刑差异时指出,由于受政治、社会和法庭组织特征的影响, 不同法院的价值观和司法信念的不同,出现各种量刑结果均比较合理。
对于法官之间的量刑差异,研究也作了多种合理解释。安德森等对量刑差异进行梳理后指出,量刑结果受法官的个人背景因素影响。这与法官的不同惩罚哲学有关,持报应主义的法官比功利主义的法官量刑更重。 约翰逊等的研究指出,法官在信息资料不全的情况下,经验习惯容易因资料不足而对被告人特征(违法严重性、前科)等作出差异性判断。 除此之外,量刑差异与法官的性别和种族有关,女性法官量刑更重,黑人和白人法官的量刑存在差异。 其他一些研究对法官先前的背景,如公诉人或者律师职业经历,法官职业年限是否影响量刑差异有研究, 但结论不明显。
上述文献考察,的确反映出量刑差异受多种因素影响,法律内和法律外的因素均有。但值得疑问的是,量刑到底受何种因素的影响,这会让量刑变得毫无规律吗?因此,继续对影响量刑的因子进行梳理可以寻找到一些研究的脉络。
(三)量刑影响因子梳理
自由裁量权和量刑幅度,作为法律内因素在学术界最令人担忧。与此相对,法律外的因素,如司法干涉、法官腐败所出现的量刑差异,也是否定量刑公正的重要因子。上述两个方面的因素相结合,也就出现了极端个案的量刑差异。但司法研究并不能受个案影响,司法活动的开展也不能因极端个案的影响而否定一般性。因此,要对影响量刑的因子做出分析,必须借助于大样本的统计观察结果。对若干个定量研究文献分析后发现,量刑主要受如下因素影响:
(1)犯罪危害性和严重性。格雷斯伍德利用佛罗里达的量刑指南和量刑资料,指出犯罪严重程度和刑事记录是影响量刑轻重的主要因素,并且审判模式和性别对量刑也有显著影响。 克莱默等的研究也指出,犯罪类型、犯罪的严重性以及犯罪记录是量刑轻重的影响因子。 里奥纳多的研究显示,犯罪数额并不影响是否监禁的决定,但是犯罪数额的确影响量刑的长度。
(2)前科越多,量刑越重。斯迪芬斯迈尔等利用宾夕法利亚洲的资料研究显示,是否监禁和量刑长度,主要由犯罪行为的严重性和被告人的犯罪前科决定。 里奥纳多和桑珀的研究也显示,量刑差异最主要受刑事犯罪前科、犯罪严重性、有罪答辩等法律内因素影响。 伍德布莱德的研究也显示,法官在量刑时,会考虑累犯的风险,并对有这种倾向的人判处更重的刑罚。
(3)犯罪自白者量刑更轻。研究指出,犯罪自白(自首)、有罪答辩、辩诉交易的开展,有利于法官基于被告人的悔罪态度或降低司法成本,判断犯罪人的危险性更低,从而给被告人判处更轻的刑罚。
(4)社会经济地位越高,刑罚越轻。社会经济地位的影响程度并不相同,肯定者们认为,大量研究已经指出社会经济地位对量刑轻重有影响,呈正相关。 然而,其他研究却指出,社会经济地位对量刑的轻重程度并没有影响。 伍德雷格最新利用辛辛那提2948个被逮捕男性的量刑资料研究显示,犯罪人的社会经济地位对量刑差异的确有显著影响。
(5)女性比男性量刑的刑期更轻。研究显示,性别对量刑结果有差异,女性比男性的量刑更轻。这可归纳为5个重要的原因:(a)家庭原因等实际状态(Practically),(b)保护妇女的侠义精神(Chivalry),(c)妇女比男性实施犯罪的能力更弱的质朴观点(naiveté),(d)女性更容易被改造的经验观察(Perceived permanence of behavior),(e)对于男性犯罪的恐惧和危险性观察(Perception of dangerousness)。女性对于犯罪的恐惧和危险程度倾向于实施更轻的犯罪。
(6)其他影响因子。受害人和被告人之间的关系上,阿尔伯尼特的研究指出受害人的撤诉有利于减轻犯罪人量刑的倾向,但这并没有达到显著水平。 在年龄、种族问题上,法官通常会考虑这些反应并影响犯罪人危险程度的相关因素决定量刑轻重,并因此在不同年龄群体、民族间出现量刑差异。
本部分的外文文献梳理显示,量刑差异及其影响因子的研究非常活跃,这在美国已有将近半世纪的历史。这对中国开展量刑差异的研究有非常重要的借鉴意义,在方法和变量选择上为本文研究的开展提供了支撑。不仅如此,对各种量刑差异的解释,也为论证量刑差异与否存在的合理性提供帮助。因此,无论中国存在或不存在量刑差异,在一个合理限度以内,各种研究结果都可以接受。
三、资料、问题与研究设计
如前述,中国刑事法学界并没有可循文献进行量刑差异的定量研究,这或许受限于资料和数据的获取途径。这也就出现,中国司法界至今并没有对量刑差异的存在性产生怀疑。作为一个研究尝试,我们希望能在探索过程中,客观谨慎地对量刑差异的存在性进行检验,并对影响量刑的因素进行检测。
(一)研究资料
由于目前并无可行的司法数据供研究,因此我们自行采集了四川省德阳市6个基层法院的判决书作为量刑公正的研究样本。四川省德阳市中级人民法院下属6个基层法院,分别是中江法院、绵竹法院、旌阳法院、广汉法院、什邡法院、罗江法院。由于罗江县法院的样本太小且各年度参差不齐,不具有分析意义,我们直接剔除。基于犯罪样本的可比性,我们只对基层法院的数据进行研究,而没有采集德阳中级人民法院的量刑数据。在判决书样本的选择上,我们希望检测2010年最高法院量刑指导意见以及四川省高级人民法院自2010年10月下发《量刑指导意见实施细则(试行)》以后,司法机关的反馈情况。因此,我们以2009年和2012年为分析年份,从而做对比。由于样本量受限,2010年的资料并不适合做两个时间段的研究,2011年的数据资料也不能充分反映量刑意见对法官的指导,故没有选择这两个年度。
在罪名样本选择上,我们先前的研究显示,中国刑事司法实践中常发罪名是盗窃罪、抢劫罪以及故意伤害罪。 因此,基于样本分析量上的考虑,我们仅对上述两个年份的盗窃、抢劫和故意伤害罪判决书进行收集。在样本数据录入方面,我们参考文献梳理所发现的影响量刑和检测量刑差异的多个变量,编码录入数据,形成分析数据库。 表1是各基层法院样本、年度的分布情况。
(二)研究问题与设计
在本研究中,我们的研究问题为:(1)法院间的量刑是否普遍存在差异,这个问题可以作为检测中国法院间的量刑存在差异的方法尝试;(2)如果有,这些量刑差异因受何种因素影响,这可为未来中国刑事司法实践中减少量刑差异提供证据支持;(3)法官量刑期限受何种因素影响,这可结合外国研究的状况研究中国法官的量刑考虑因素。
1.数据整理
在检测量刑差异的样本时,我们以个罪的宣告刑作为分析样本。样本量有限,且涉及个罪和数罪问题,我们没有对涉及共同犯罪的合并执行刑期进行研究。在分析各法院之间的量刑是否存在差异时,我们首先借助于一元方差分析(Oneway),直接对不同法院的量刑平均值作比较。考虑到方差分析所需要的两个重要条件是,满足方差齐性和正态分布假设。 因此,在分析法院之间是否存在量刑差异时,我们对数据做了幂阶梯转换(Ladder)。数据转换虽然有犯第一类型或第二类型错误的风险,但是这种处理是统计分析中的常用手段。仅以本文量刑差异的研究主题为例,多个分析文献显示了对数据以对数转换处理。 我们注意到,由于样本数量可能不足,数据转换可能改变原有数据反映出的信息。因此,在进行方差分析时,也对原始数据做了比较。
在分析对象上,我们分别对2009年、2012年的量刑数据作分析,并将两年的数据合并到一起检测不同法院的量刑差异。研究已经指出,量刑并不呈标准正态分布,而是近似于泊松分布。我们在对宣告刑作探索性分析时也发现,数额较大(定罪标准)的盗窃罪宣告刑聚集较多,而数额巨大(加重条款)以上较少,因此我们对宣告刑按不同数额分段处理。2010年四川省量刑指导意见规定,德阳市盗窃罪数额较大标准为700元,数额巨大标准为7000元,数额特别巨大的标准为5万元。 如表2所示,我们将盗窃罪数额作为变量控制标准,按不同组分别进行比较,并对数据进行相应转换。由于在盗窃700-7000元段,宣告刑数据转换后满足正态分布假设的转换模式不一致(对数 Vs 平方根倒数 Vs 平方根),因此我们在探索性分析后,仅将700-2000段的宣告刑按平方根倒数(1/Sqrt)转换后作为分析对象。抢劫罪的数据转换比较理想,因此分析过程中直接以对数转换即满足正态性假设条件。类似的道理,故意伤害罪的量刑转换后接近于正态分布,这基本上可以做量刑比较。尽管故意伤害罪的转换标准并不统一,可能存在方法瑕疵。然而,如表3所示,故意伤害罪的量刑因方差齐性假设的违反,也并不适合做组间比较。
2.分析方法
在完成数据转换后,我们结合转换后的数据首先进行了方差齐性假设检验(Bartlett's test for equal variances)。如表2所示,不能拒绝不同法院在各组间的量刑满足方差齐性假设的只有2009年的(700-2000元)组(带“√”)。方差齐性假设作为方差分析的条件之一,这使得本文的研究结论较苛刻。然而,如果不满足方差齐性假设条件,不同组间的变异程度不同,这容易使平均值比较犯错的可能性更高。
由于一元方差分析的结果是任意两个组别的差异,这就意味着只要有一组法院比较出量刑差异,那么整体量刑比较均会出现差异的显著结果。如果仅以此得出结论,那么就可能忽略其他组比较,也不能看出量刑差异是普遍情况,还是个别情况。因此,在进行方差分析时,我们使用多组配对比较(Scheffè multiple-comparison test)。 据此,不仅可以分析是否存在量刑差异,而且可以发现量刑差异存在于哪些法院间。
为了检测和分析影响量刑的因子,我们在后文中使用了多元方差分析(MANOVA)和多元线性回归(Ordinary Linear Square Regression)。在进一步探索造成量刑差异的原因时,我们还对总模型进行了分解。方差分析,可以看出各变量对量刑差异影响。回归分析,有助于理解量刑的影响因子以及差异在不同法院之间的水平大小。文献梳理过程中,我们发现各种分析量刑差异的方法,主要是线性回归或逻辑回归(Logistic Regression), 在大样本分析模型中还有少量研究使用HLM和Multilevel Modeling来分析法院之间的量刑差异。按照我们的设计,量刑期限以月为单位,作为连续变量处理自然没问题。最令人迷惑的是,五个法院基层法院盗窃罪(sktest,Pr(Kurtosis)==0.000, P==0.000)、抢劫罪((sktest,Pr(Kurtosis)==0.001, P==0.000))、故意伤害罪(sktest,Pr(Kurtosis)==0.000, P==0.000)量刑结果并不符合正态分布的假设,这在统计模型的前提上自然存在一定的争议。然而,量刑差异在方差分析中已经基本解决,多元回归模型的目的是为了寻找到影响量刑以及对量刑差异起作用的因子,因此,这基本可以作为发现一些显著影响因子的方法。
表3是多元回归模型中使用的变量,选择这些变量的原因是基于文献发现。量刑期限作为因变量,中江法院作为检测是否存在量刑差异的参照,分别和绵竹法院、旌阳法院、广汉法院、什邡法院相比较。同时,为了考察2010年最高人民法院和四川省高院量刑指导意见对五个基层法院量刑的影响,我们将2009年设置成比较的参照年份,从而看2012年与其出现差异的情况,从而检验2012年的量刑指导意见。在进一步分析量刑的影响因子时,我们将犯罪人的性别、户口、年龄等身份特征加入到控制变量中,同时对表征犯罪严重性的犯罪数额,伤害程度, 以及受害人性别(不考虑男女共存)、受害人个数,犯罪是否完成等作为检测这些变量对量刑差异的显著影响。尤其是,我们将代表犯罪人人身危险性的前科次数作为影响量刑因子的重要控制变量。在检测受害人的悔罪态度时,我们将自首和坦白与没有这些情节的犯罪作比较,从而检测这些情节对犯罪的影响。同时,将赔偿受害人与否,也作为检测受害人积极赔偿对于量刑的作用,没有任何赔偿的作为参照。在犯罪原因上,我们将一般犯罪作为参照,分别将迫于生活压力、临时起意、预谋犯罪、仇恨报复等代表犯罪人主观恶性的变量作为考察犯罪人刑罚轻重的虚拟变量组做比较。基于已有研究提出,中国的羁押期限较长,我们欲对犯罪轻重和审判周期长短的关系进行检测,从
而发现是否量刑更轻的犯罪审判周期更短。 与此同时,我们将审判程序设置为虚拟变量,简易程序作为参照,探讨同等条件下简易程序和普通程序的量刑区别。基于已有研究指出,律师在量刑方面所起的作用甚微, 因此我们也想检测下律师参与辩护是否可以降低被告人的处罚。
毫无疑问,从观念上来看,不确定性理论可能更有说服力,因为影响法官量刑的因素错综复杂,难以做出绝对精确的研究。然而,法官量刑的确可能基于一种习惯和法庭社区氛围,从而在大量的量刑经验中总结出一套适用的方法。况且,社会科学并非火箭科学,我们基于文献考察后引入若干控制变量也仅是作些初步性探索研究,更进一步的努力我们将考虑更多的因子。
四、研究发现与讨论
(一)法院间量刑差异
1.五个法院整体观察
表4是五个法院整体量刑比较的差异结果,此表所表示的是:是否这五个法院中有任意两个法院的量刑存在差异。从各组间的平均值来看,五个法院的量刑似乎都存在一定差异。以盗窃数额700-2000元为例,五个法院2009年和2012年的所有量刑的平均值是8.15个月。中江法院两年的平均值是7.93个月,而绵竹、旌阳、广汉、什邡的平均值是6.64个月、8.36个月、7.08个月、9.15个月。从数据结果来看5个法院的的确存在一定差异,然而,这种差异并没有达到显著程度(F=0.58,P=0.68)。严格意义上说,这个比较可能不妥,因为五个法院量刑之间的方差齐性并不成立【Bar Chi(2)=54.40,p=0.000】。因此,很难准确地说明,五个法院2009年和2012年之间的量刑存在差异。
如表4所示,方差齐性假设检测反映出适合做法院间作比较是:
(a) 盗窃罪2009年的700-2000元(平方根倒数转换)
(b) 盗窃罪2009年7000-5万元(平方根转换)
(c) 盗窃罪2009年和2012年5万元以上的整体观察(原始数据)
(d) 盗窃罪2009年和2012年5万元以上的整体观察(平方根倒数转换)
(e) 盗窃罪2012年5万元以上的观察(原书数据)
(f) 盗窃罪2012年5万元以上的观察(平方根转换)
(g) 抢劫罪2009年和2012年的整体观察(原始数据)
(h) 抢劫罪2009年观察【原始数据(Bar Chi2=8.18,P=0.085)】
(i) 抢劫罪2009年观察(对数转换)
结合表2正态分布假设检验结果,最准确的量刑差异检测项目应当是(a)、(f)、(i)。
不妨以2009年抢劫罪为例,五个法院2009年抢劫罪的量刑平均是46.38个月。中江法院两年的平均值是42.33个月,而绵竹、旌阳、广汉、什邡的平均值是114个月(样本=2)、52.8个月、38.71个月、54.3个月。从F值来看,5个法院的量刑数据的确存在显著差异(F=2.67,P=0.037)。然而,由于正态性假设不成立,这个结论存在极高的错误可能性。将量刑取对数转换后进行数据转换,充分印证了抢劫罪之间五个法院的量刑并没有显著差异
如果不考虑方差齐性问题,2009年各法院在故意伤害罪的量刑可能不存在差异,但是2012年的量刑原始数据出现差异。但我们并不愿意轻易下此结论,因为不同年份和两年的整体数据都表明F检验违背了方差齐性条件。但无论怎样,我们倾向于认为,就故意伤害罪两年的整体情况来看,五个法院之间并不存在太多差异。
从表4中2009年和2012年的量刑情况来看,各法院的量刑平均值并没有发现有显著的共同趋势。盗窃罪、抢劫罪、故意伤害罪中各年份的量刑平均值没有发现有减少,与之相反,故意伤害罪2012年的量刑比2009年更重。对于这个问题,不妨用犯罪稳定理论做些探讨,在各法院每年的犯罪基本上没差别的情况下,故意伤害罪2012年的量刑可能比2009年更重。同理,我们发现2012年中江法院的抢劫罪量刑比2009年更重,平均值相差11.11月。 不过,由于涉及伤害程度和抢劫数额的差异,这个结论的真实性将在多元回归模型回答。
如前述,即使各法院存在量刑差异,但是我们并不清楚差异是由某一法院引起,还是多个法院出现差异的共同趋势。因此,下文将继续借助于 Bartlett 组间比较进行分析。
2.法院间Bartlett Scheff多组比较
如表5所示,我们将各法院直接按两两配组后比较后,基本没有发现各法院组间有显著差异。例如,2009年中江法院和绵竹法院在盗窃犯罪上,量刑的平方根倒数相差0.04(注:原始数据量刑显示,绵竹比中江法院量刑多1.05个月)。与此相反,旌阳法院、广汉法院、什邡法院的量刑稍微比中江法院要轻,但无论如何都没有达到显著水平。就其他盗窃罪来看,情况大致相同。存在差异的是,2009年盗窃7000元至5万元的量刑,旌阳法院和绵竹法院存在显著差异(P=0.029)。从量刑的平方根来看,显示旌阳法院比绵竹法院重1.59,原始刑期显示二者之间相差20.2个月(见表4)。但这个结论需谨慎对待,因为绵竹和旌阳2009年盗窃7000—5万的犯罪在样本上相差20个(27 Vs 7,见表4)。总的情况看,我们在2009年盗窃罪中,并没有发现其他几个法院组有差异,这个状况在相似样本上非常明显。例如,盗窃7000-5万元的犯罪中,2009年和2012年中江法院和绵竹法院都是41个调查样本,二者之间的量刑分别是32.34月 Vs 35.95月(表4),二者之间的量刑差异不显著。再如,2012年盗窃5万元以上的犯罪,中江法院和旌阳法院的样本都是7个,二者之间的量刑分别是119.21 月 Vs 121.86 月,原始数据量刑不显著仅相差2.6月(p=1.000),数据转换后二者之间的平方根相差0.24(p=0.999)。
2009年的抢劫罪之间似乎存在量刑差异,然而,抢劫罪各法院间的样本差异较大,并不能得出有效结论。值得说明的是,2009年样本量大致相当的广汉和什邡法院(20 Vs 14),原始数据显示相差15.59个月(p=0.784),然而差距并没有达到显著水平。即使将量刑取对数转换,二者之间的差距变为0.283,但仍然无法得出显著的量刑差异结果(p=0.782)。进一步值得说明的是,不考虑方差齐性前提条件下,2012年中江法院和旌阳法院之间的量刑差异的确非常明显,原始数据相差-16.53月(p=0.21),但对数转换后二者之间的对数差距为-0.53,并且达到显著水平(p=0.003)。这个问题的可能解释是,2012年的量刑指南按照
不同情节使用百分比减刑,可能在某种程度上打破了法官量刑的既定习惯,从而在数学量化的选择比例上出现差异。 当然,这只是我们的一种假设,毕竟这种分析的前提——方差齐性已经违反。然而,这些解释仅是一种可能,还有犯罪数额以及其他案件的特殊情况没有考虑,依然需要多元回归量刑模型解释。
(二)多元回归模型:量刑差异及影响因子检验
表6是多元方差和线性回归分析模型的最终结果,后文中将进一步展示各变量对量刑及量刑差异的影响。F值和决定系数R2显示,方差和多元回归分析模型非常有效,分别解释了盗窃罪74%、抢劫罪75%、故意伤害罪54%的量刑差异。不可否认,R2还说明另外一个重要信息,尚有若干影响量刑的未知因素没考虑进去,尤其是故意伤害罪的可探索变量更多。
如表6所示,在大样本分析模型下,方差分析和多元回归模型均显示四组法院比较中只有一组法院有差异,剩下的三组法院量刑均无差异。这进一步说明,我们在一元方差分析模型得出的结论基本成立,法院间量刑差异并不普遍。控制所有解释变量后,盗窃犯罪广汉法院的量刑平均水平上比中江法院高7.82个月,抢劫罪中江法院比旌阳法院高31.14个月,故意伤害罪旌阳法院比中江法院高92.18个月。
从解释或控制变量的分析角度来看,模型也探索到影响法官的若干重要影响的因子。就各影响因子来看,回归系数(Coef.)和标准化系数(Beta)说明了各变量对量刑和量刑差异的作用大小。盗窃罪量刑主要受犯罪人年龄、犯罪数额、前科、犯罪动机、犯罪自白、自我聘请律师、审判周期、审理程序所影响。抢劫罪主要受犯罪人年龄(p=0.087)、犯罪数额、自我聘请律师、从严处罚情节影响。模型中纳入的故意伤害罪量刑影响因素较少,法官量刑主要受被害人的伤害程度影响,受伤人数也是一个重要参考因素(p=0.088)。
(1)犯罪人身份特征。从犯罪人年龄来看,年龄越小的财产犯罪人所得到的处罚更轻,平均每增加1岁,盗窃罪刑罚增加0.21月(6天),抢劫罪刑罚增加0.66月(22天)。这可能与低龄青少年的容易越轨和法律对未成年人的从轻处罚倾向有关。 我们并没有发现,男性犯罪人和女性犯罪人的量刑有差异,农村人口与城市人口之间的刑罚有差异,文化程度的高低对于量刑没有影响。
(2)犯罪危害性与严重性。模型显示,犯罪数额是法官量刑考虑的重要因素,数额每增加1000元,盗窃罪量刑将增加0.47月(14天),抢劫罪量刑将增加2.45月(73.45天)。四川省2010年颁布的量刑指导意见,也按照犯罪数额与量刑的积极关系进行指导。 前科对盗窃罪影响较大,平均每增加一次盗窃前科次数,量刑将增加2.36月(70.8天)。前科和犯罪数额,代表了犯罪人犯罪习性和犯罪严重性,这两个因素对财产犯罪的影响说明法官的量刑结果符合常理。即,犯罪越重的人,社会危险性越高的人,刑罚越重。故意伤害罪的危害性反映在致人伤害程度上,这与中国刑法对不同伤害程度的量刑幅度设置有关。 模型显示,伤残等级每上升一个(如:轻伤→重伤),量刑将增加12.23月,这和常理比较一致。模型也显示,受害人性别对量刑并没有影响。
(3)犯罪原因。预谋犯罪对盗窃罪的量刑处罚影响较大,与没有这些情节的犯罪人相比,预谋性盗窃犯将多判处7.68个月的刑期。 模型中没有发现迫于生活压力的生存性犯罪者获得更低刑期的显著性,是否偶然发生的临时起意犯罪也没有发现对量刑有影响。
(4)犯罪自白。犯罪自白对于盗窃罪的量刑有影响,自首者的量刑宽宏程度比坦白的宽宏更大。与没有这些情节的犯罪人相比,自首者的量刑将减少11.8月,坦白者的量刑将减少7.72个月。 模型也显示,犯罪自首对于抢劫罪降低刑期有一定影响趋势,但没有达到显著水平。然而,对于具有严重社会危害性的犯罪,自首或者坦白对故意伤害罪的量刑并没有太大影响。
(5)主动赔偿。主动赔偿对盗窃犯罪者来说较为有利,主动赔偿者的量刑比没有赔偿的人的量刑将减少4.43月。但是赔偿对于抢劫和故意伤害等严重犯罪来说,并没有太大意义。
(6)辩护人效果。聘请律师作辩护,这是多数犯罪人希望用法律手段维护权益的做法。模型显示,刑事诉讼中律师辩护起了较大作用,犯罪人自己聘请律师的辩护效果最好。 与先前研究所指出的律师作用不强相比,我们的研究指出律师在刑事诉讼中发挥了重要作用,在控制相关变量后,聘请律师的犯罪人比没有律师的犯罪人所判刑期更轻。 盗窃罪中,犯罪人聘请律师作辩护人比没有律师的人将少判7.21月,抢劫罪聘请律师的比没有聘请的少判17.83月。财产犯罪中,法律援助律师没有为被告人的刑罚带来显著效果,与那些聘请律师的犯罪人相比,法律援助律师的效果明显不如聘请律师。
(7)量刑情节。模型显示,从宽处罚和从严处罚对犯罪人的量刑作用呈鲜明对比。从严(从重处罚)处罚对犯罪人的量刑影响更大,抢劫罪模型显示,具有从严处罚情节的罪犯将多判24.16月。遗憾的是,从轻处罚并没有为犯罪人带来显著性的刑罚优遇效果。这可能与量刑活动中并没有充分考虑从宽情节所应该具有的刑罚宽宏,尽管判决书上明确说明从轻处罚。“从轻处罚”只具有文本效应而无刑罚效应,这和我们早期的理论分析一致。
(8)审判活动。审判周期对量刑的影响反映出一些乐观信息,量刑的长度与审判周期呈正相关,平均每延长100天,量刑将增加9个月。这与犯罪的严重程度有关,按常理,犯罪越重,审理周期越长。我们在模型探索过程中利用Pearson相关系数探索发现,财产犯罪的数额与审理周期在10万元以下相关系数达0.414(P=0.000);故意伤害罪的伤害程度与审理周期的模型也显示,相关系数为正(r=0.06,p=0.49)。模型也显示,适用普通程序所判处的刑罚更重。审判程序对量刑有重要影响,中国刑事诉讼法已经在适用简易程序和普通程序上的可能刑罚效果上做了明文规定。简易程序适用于可能判处三年以下有期徒刑的犯罪,盗窃犯罪的“数额较大”量刑梯度是三年以下有期徒刑、拘役、管制,“数额巨大”以上的量刑梯度才是3年以上10年以下。这自然解释了,为什么盗窃犯罪中适用普通程序的人将比适用简易程序者将多判11.88月。故意伤害罪也显示了类似趋势,适用简易程序审理的案件有量刑更轻的趋势。
Beta标准化系数反映了上述各影响因子的作用,影响盗窃罪量刑排名前三的依次是犯罪数额、审理程序、犯罪前科,这说明法官在盗窃罪中非常重视犯罪的社会危害性大小和再犯倾向。审理程序的重要性,这主要表现为犯罪数额决定了量刑轻重的可能性,我们在初始模型的探索过程中发现,盗窃7000元以下占了69.73%,这就说明轻罪盗窃是司法实践中的主要犯罪类型。抢劫罪排名前三的依次是,犯罪数额、从严处罚情节、律师辩护,这同样是犯罪严重性的表现。中国刑法规定抢劫罪的起刑是3年,而抢劫罪的加重处罚条款中有8个加重情节。
(三)量刑差异原因解释
量刑结果和量刑差异是如何做出的呢?上文已经指出,盗窃罪量刑在广汉法院和中江法院可能出现差异,抢劫罪和故意伤害罪量刑在中江法院和旌阳法院可能出现差异,但其他法院间的比较并未发现类似结果。直到目前为止,我们也还未对法院间的差异进行解释。本部分将表6的多元回归模型,分解成多个回归模型,看不同变量如何影响法院之间的量刑。
如表7所示,回归分解模型为量刑差异寻找到部分原因。总体来看,犯罪数额、前科、律师辩护、量刑情节、审判模式是引发量刑差异的重要原因。以盗窃罪为例,在控制审判程序后,中江法院和广汉法院的量刑差异开始出现量刑差异,而之前中江和什邡法院之间的量刑差异得以消除(模型一至模型十)。这可能和中江法院审理的盗窃犯罪以普通程序审理有关(83.54%),什邡法院有40.74%的案件、广汉法院有37.04%的案件是通过普通程序审理。如前十个模型所示,中江法院的盗窃罪量刑一直比什邡法院高。当控制审判程序后,模型十一和模型一相比,减少9.8个月的量刑差异(-12.8+3.0),并且这种差异不再显著。按照中国刑事诉讼法规定,简易程序审理轻微刑事案件,主要是可能判处3年以下有期徒刑案件,而普通程序则是审理严重犯罪,并有可能判处3年以上刑期。这就是模型十和模型十一比较,显著差异的两个法院变化的原因。
同理,对比模型三与模型四,仅控制犯罪数额后就解释47%的量刑差异(r2=0.52-0.05)。并且,控制数额后,中江法院和什邡法院的量刑差距逐渐缩小(对比模型一、四、十)。因此,我们在对数额分布列联表检查后发现,7000元以上的案件中江县法院分别是37.2%,什邡法院是24.63%,广汉法院是26.25%。13%的犯罪数额分布差距,是造成量刑差异的重要原因。不过,这个解释对于改进中国的量刑处理程序并没有多大意义,因为犯罪数额的分布具有随机性。
在前科的考察过程中,我们发现中江法院的前科平均次数比什邡法院低0.04次。如前述逻辑,前科次数越多,刑罚越重。这就是为什么模型五控制前科次数变量后,中江法院和什邡法院的量刑差距扩大0.48月的原因(10.85-10.37)。与犯罪数额一样,前科具有随机性,按照犯罪人人身危险性量刑自然没有问题。类似问题,我们也发现从严处罚、自我聘请律师、法律援助律师在中江法院和什邡法院之间相差5%、12%、9.5%。因此在控制这几个变量后,什邡法院和中江法院之间的量刑差异缩小2.11月。我们在其他变量的回归模型探索中仍然有类似发现。
抢劫罪各法院之间的量刑差异解释稍微复杂,因为不仅法院之间的差异存在交替现象,而且最终的模型十一和模型一相比,控制若干变量后,中江法院与旌阳法院的量刑差异反而相差25.32月(31.14-4.82)。对比模型一和模型二中各法院之间的量刑差异情况,我们发现2012年后法院之间的量刑差异反而扩大,这进一步说明量刑指导意见发挥的作用有限。中江和旌阳法院犯罪数额平均值相差3816.3元(7491.8-3675.5)的事实,解释了为什么控制犯罪数额后解释了33%的量刑差异。类似情况同样出现在前科、量刑情节、律师聘请、犯罪自白变量上。总的来说,多元回归模型的解释功能从6%上升到75%,表明我们的确解释了大量造成法院间量刑差异的多种因素。
回归分析模型也间接支持表4所反映出的信息,2012年的量刑比2009年量刑更重(模型二至六)。至于模型十一显示的中江法院和旌阳法院依然存在的量刑差异,可能还有其他
变量影响法院之间的量刑差异,如法官态度、法律理解、公诉人作用等因素,这需要将来的研究继续展开。在逐步探索过程中,我们发现伤害程度和受害人个数解释了23.5%的中江法院和旌阳法院之间的量刑差异,其次是从严处罚(5.7%)和赔偿受害人(4.8%)。
总的来看,我们的分析和最高人民法院颁布的《人民法院量刑指导意见(试行)》四川省高级人民法院颁布的《量刑指导意见实施细致(试行)》逻辑一致。诸如前科、犯罪数额等也与常理相符合。就量刑差异存在性问题上,我们的确发现每个罪名有一组法院可能存在量刑差异。然而,对于这个结论的普遍性来看,因数据所限,本文并没有发现非常普遍和相差悬殊的量刑差异。未来一段时间内,我们将拓宽调查样本、增加变量收集等措施作进一步检测。
五、讨论与结论
中国刑事司法中的量刑差异是普遍现象吗?本文通过对最近20年的量刑差异研究进行梳理后,发现中国学者普遍认为存在严重量刑差异仅是对极端个案分析后得出的结论,这些循环往复的理论研究并没有定量研究和分析技术支撑。基于这个发现,本研究借助于梳理英美国家最近几十年发表的量刑差异文献,寻找国外量刑差异是否可检测,以及目前的理论现状和解释量刑差异的影响因子,并在此基础上设置检测中国量刑差异的多种分析变量。
本研究利用德阳市5个基层法院的盗窃罪、抢劫罪、故意伤害罪的1039个量刑判决书样本,借助于方差分析和多元回归分析后,没有发现有力的证据说明5个法院间都存在显著性的量刑差距。回顾本文,我们得出如下结论:
第一,从量刑平均数来看,五个法院的平均量刑存在直觉上的差异。但在进行正态分布和方差齐性验证后发现,仅从平均数得出法院间存在量刑差异并不科学。
第二,一元方差分析和多组配对比较方差分析显示,量刑差异只是个别现象。多组转换数据和原始量刑数据的一元方差分析以及多组配对比较的方差分析模型显示,只有旌阳法院和绵竹法院间存在量刑差异,其余三组法院以及在其他犯罪中旌绵之间不存在差异。
第三,多元方差和回归分析模型显示,控制若干影响量刑差异的变量后,法院之间的差异并不普遍存在。盗窃罪在中江法院和广汉法院之间,抢劫罪和故意伤害罪在中江法院和旌阳法院之间存在显著差异。
第四,回归模型显示,量刑的影响因子并非错综复杂而不可检测。盗窃罪量刑主要受犯罪人年龄、犯罪数额、前科、犯罪动机、犯罪自白、自我聘请律师、审判周期、审理程序所影响。抢劫罪主要受犯罪人年龄、犯罪数额、自我聘请律师、从严处罚情节影响。故意伤害罪受被害人的伤害程度影响。
第五,多元回归分析模型,解释了法院之间的量刑差异的原因。不同法院犯罪数额的分布的差异,以及普通程序和简易程序之间的适用差别,解释了为什么什邡法院和中江法院之间的量刑差异。财产犯罪之间的量刑差异还与从严处罚、犯罪前科、犯罪自白、律师聘请有关,伤害程度、赔偿受害人以及从严处罚的应用等说明了这些变量解释了法院之间可能的量刑差异。
第六,研究也揭示,各种量刑影响因子的适用差异。法官在量刑活动中对刑事法规定的量刑影响因素上存在偏好,法官心理上更容易选择从严处罚(从重处罚),而从轻处罚或减轻处罚实质上并没有降低犯罪人的处罚。法庭审理案件的程序需要严格管理,选择适用简易程序和普通程序的条件应该固定下来。专业律师在中国刑事审判活动中发挥较大作用,律师辩护有效减轻了被告人的刑期。
第七,对比2009年和2012年的量刑数据,我们发现量刑指导意见对法官量刑所起到的作用非常有限。盗窃罪和抢劫罪中,法院之间的量刑差异显著性被扩大,故意伤害罪也呈现出同样趋势。
本文发现四川省德阳市五个法院之间的量刑差异并不普遍,可以借助于社区理论来解释。由于五个法院之间相隔较近,社会文化环境相似,法官所受的地域和政治影响、价值观、选任培训等因素均比较接近。 德阳市中级人民法院与下级人民法院的刑事审判活动交流比较频繁,并定期开展法官专项培训活动,这一定程度上为统一量刑尺度,避免下级人民法院刑事量刑的随意化而出现大量差异发挥了一定作用。至于2010量刑指导意见对法官的量刑指导有限,这有两个解释可能。第一种是,借助于经验观察理论来解释,部分法官量刑受多年习惯和经验影响所形成的量刑直觉判断在短时间内没有被完全消除,从而出现量刑差异扩大的趋势。第二种解释是,借鉴美国联邦量刑指南实施后的教训,2009年德阳地区法官因相似的背景和习惯导致量刑上的一致,而量刑指导意见打破了这种因习惯所形成的均衡,从而出现新的量刑差异。不可否认,还有第三种可能是,受2012年和2009年样本总量上的差异影响,我们揭示出与真实情况不一致的结论。
本文以德阳市为视角观察中国的量刑差异,同样可能犯以偏概全的错误。但受限于目前国家层面的数据无法获取,因此管中窥豹还是可见一般。社会科学研究,数据分析并不能精确揭示出所有客观事物之间的关系。与此相似,量刑差异和量刑公正的研究,也不是一篇文章所能解决。尤其是对于不同地区的量刑差异检测和研究,还需要继续探索。正因为上述多种迷惑,我们将继续运用更优的定量分析方法,还将借助于定性研究检验并推广本文的结论。基于此,作者持开放态度,欢迎广大学术同仁批评指正。
内容摘要:主流观点认为中国普遍存在量刑差异,但该结论实证依据不足。本文借助于德阳市5个法院的1039个样本,检测盗窃、抢劫、故意伤害罪的量刑情况。研究按四组配对比较后发现,三组法院量刑均衡。盗抢罪量刑受数额、前科、审理程序、自白、律师参与、从严处罚等影响,故意伤害罪因伤害程度、受害人个数、赔偿等有别。2010年量刑意见有助于规范量刑,但法官更倾向于从严处罚。中国未来的量刑改革,还需具体规定如何适用从宽从严集合情节。
关键词:量刑差异;不显著;影响因子
引言: 未被验证的量刑差异与规范改革
量刑公正,是中国刑事法学界普遍关心的问题,为此掀起了长达20年的量刑规范化讨论。这场探讨的主题是:中国刑事司法实践中存在严重量刑差异,应采取多种措施控制。 受学术研究的影响,中国各地刑事司法机关陆续出台一些量刑规范化政策,并曾经呼吁开展电脑量刑等智能化操作模式。这些举措的背景反映出法官量刑具有较大随意性,量刑结果存在失调。 在此趋势下,中国最高司法机关采纳了“量刑规范化”这个理论和实务界总结出来的经验,陆续细化不同犯罪等级的量刑幅度,以求最大化地做到量刑均衡。尤其是,最高人民法院2010年出台《人民法院量刑指导意见(试行)》,以求“实现量刑均衡,维护司法公正”。 以此为基础,上海、北京、四川等各省级司法机关陆续制定具体的量刑指导细则,从而在本地司法管辖范围内规范量刑。
学术、司法、立法、实务互动,这一系列现象似乎肯定了中国刑事司法中广泛存在着量刑差异。学者对“是否存在量刑差异”的个案考察结果,也进一步支持了“量刑存在失衡”这个命题。 然而,与海量的量刑公正和量刑均衡理论研究相比,中国目前尚没有刑事司法量刑活动的经验研究揭示出这个问题的真实性。 这就意味着,在中国刑事审判实践中存在严重量刑差异的命题尚没有得到数据验证。
电脑量刑改革的否定,已成为中国刑事量刑规范化进程中尴尬的一幕。然而,如果不能冷静客观地对待量刑改革和量刑公正这个话题,中国刑事量刑改革的初衷可能也将难以实现。鉴于学术界对量刑公正众说纷纭,且缺少必要的数据支持,我们开展了本次实证研究。这个针对量刑失衡问题的实证研究,有两个基本的假设:一,中国刑事审判实践中,不存在普遍意义的量刑差异;二,中国的刑事审判实践中,存在着严重的量刑差异。我们认为,司法改革需要一个客观的检验过程,才能反映中国刑事司法的真实状况。否则,歇斯底里地呼吁中国刑事量刑改革毫无意义。因此,如果出现第二种结果,那么未来的司法改革应当找准造成量刑差异的因素,制定科学的刑事政策。如果是第一种结果,中国刑事审判中的有益经验就应当继续发扬。
一、量刑公正与量刑均衡:被渲染的真命题?
中国学者对量刑公正和量刑均衡的研究,成果颇丰!沈德咏从刑罚文明史角度,认为人类刑法文明史,就是一部为实现刑罚目的而不断追求量刑公正的历史。 基于这个崇高的价值追求,学术界展开了深入的探讨。周光权等人从量刑裁判必须考虑的社会危害性因素方面,结合量刑情节论证了确立量刑基准的理由。 赵廷光与季卫东等围绕电脑量刑的准确性和科学性,以及中国当下是否应当开展电脑量刑展开了深入的辩论。 谢鹏程等基于规范量刑自由裁量权,从量刑程序的分离等多角度论证了促进量刑均衡的刑事诉讼程序改革措施。 陈瑞华与左卫民等围绕是否从检察机关开展量刑建议活动,作为规范法官自由裁量权、强化量刑程序的对抗性作了辩论。 林维、熊谋林从量刑情节裁判原则过于抽象、量刑幅度角度过大,论证了规范量刑的适用法则。
(一)量刑差异及其表现
纵观近20年的研究成果,几乎所有学者一致认为中国的量刑存在普遍差异。先前的研究显示,中国的量刑差异主要表现为如下两个方面:(1)同案不同判, 同罪不同罚; (2)轻罪重判, 重罪轻判。 在列举这些量刑差异的理由时,一些研究成果中举出不少案例来具体阐释说明。这些案例所反映出的量刑差异大致可分成如下几类:
第一类,同一地区法院对不同犯罪人的量刑出现较大差异。赵廷光的代表性案例显示,某区法院对四起盗窃犯罪的判决如下:判决一: 盗窃财物共计160元,有期徒刑6年(判决做出日期为6月12日);判决二:盗窃财物共计1600元,有期徒刑6个月(判决做出日期为同年6月16日);判决三:盗窃财物共计9800元(多次),有期徒刑2年,罚金300元;判决四:盗窃财物共计980元(一次),有期徒刑2年,罚金2300元。
第二类,不同地区对同一类型的犯罪量刑出现较大差异。陈海平的案例显示,2000年江西原副省长胡长清因受贿500多万元被判死刑。但此后受贿900多万元的深圳海关原关长赵玉存被判无期徒刑。 山东省某中院判了一个案子,4名被告人在半年的时间里通过一些技术手段,总共窃电价值31. 6万余元,主犯判了无期徒刑。同期,在网上炒得很热的深圳中院一个盗窃奔驰轿车的案子,一个犯罪团伙在半年时间内盗窃7辆奔驰轿车,价值700余万元,销赃得款20余万元。两案发案时间大体一致,但后案的主犯仅判15年。 陈宏伟的案例也显示,2006年上海妻子杀夫案,行为人被判14年有期徒刑,2005年包头妻子杀夫案,行为人被判处有期徒刑3年,缓刑5年。
第三类,犯罪人籍贯和户口性质的不同被判处不同量刑。非京籍人被判处缓刑的比例低于京籍人被判处缓刑的比例,采取取保候审强制措施的被告人被判处缓刑的比例远远高于被逮捕而被判处缓刑的比例,因过失犯罪被判处缓刑的被告人比例远远高于故意犯罪被判处缓刑的被告人比例。
第四类,同一犯罪人在不同审判程序被判处不同的刑期。赵廷光的案例显示,福建周宁县陈长春强奸和妨碍作证案合并判处有期徒刑3年,二审改判有期徒刑12年;山西泽州周蜡成一审7项罪名合并执行20年,二审山西高级人民法院改判为有期徒刑3年。
上述案例,的确说明了中国刑事审判在个案中存在量刑差异。然而,我们的文献考察发现,大量有关建构中国量刑公正和量刑均衡制度、避免量刑差异的讨论,除了以量刑结果展示量刑差异外,并没有对案例的具体情况作出仔细考察。即使少有的案例研究中,学者们也习惯将由个别案例引发出的量刑差异结论,推广至中国刑事司法审判实践。
(二)量刑差异及其原因
学者们常用的研究方法是用“典型案例”和“代表性案例”代表一般现象,以个别案例作论据进行量刑差异的论证和分析。因此,梳理这些案件和研究,不难发现中国存在令人担忧的量刑差异,就其产生的原因,大致可以分成如下几类:
(1)量刑幅度过大,法官自由裁量权难以限制。陈瑞华等认为,法官的自由裁量权过大是导致量刑差异的原因之一, 法官过度以自己的刑罚价值观影响量刑,导致量刑结论因缺乏规则上的自治而影响其稳定性。 周光权等认为,法定刑幅度过大是造成量刑失衡的先天原因,比如10年以上的法定刑中,往往又包括无期徒刑和死刑。这种法定刑量刑幅度跨度大、空间大、刑种多,实践中一旦出现犯罪人具有减轻处罚的情节时,判决结果就有可能超出人们对减轻处罚的心理承受力。 郭志远在分析中国法官的量刑时指出,中国现行刑法中法定刑相差达到或者超过5年的条款多达200多个,占整个刑罚的40%;加上有些规定比较模糊,不同的法官理解也不一致,造成实践中量刑不公的现象。
(2)法官忽略量刑程序的科学性,随意裁判导致量刑差异出现。例如,陈瑞华等的研究指出,法官过分重视定罪程序,轻视量刑程序。 量刑活动自身特点的制约,即法律是抽象的,而刑事案件千差万别,立法语言的开放性与刑事审判法官需要自由裁量权的特点决定了量刑活动不可能成为一种按图索骥的机械活动,在诸多可变因素的相互作用下就使得量刑失衡成为可能。
(3)量刑差异与量刑均衡的研究较少,司法认识不足。研究指出,新中国刑法学自发展以来,在最近十年才开始普遍关注量刑公正问题,对于刑罚设置、配置和效果等方面的研究成果尚显缺乏,使得司法实践中不规范行为的出现难以得到有效的遏制。
(4)法外因素对量刑公正活动的影响。研究指出,传媒的误导性报道和追求新闻效果的夸张性介绍不仅加剧了被害方的复仇情绪,也给办案机关造成较大舆论压力,法官往往屈服于舆论激起的民愤,导致量刑差异。 由于司法机关在财政、人事上受制于地方政府,地方行政的干预也容易导致量刑差异。 法官行使审判权是在具体的社会环境下进行的,许多社会因素因与案件有关而连接成各种关系网,说情、请托就在所难免,从而影响司法公正。
上述论证可谓非常有说服力,毕竟这是多年来达成的“学术共识”前提下的解析。但这些分析很难在大范围内印证,而且这种以局部代表整体的假设,通常忽略极端个案本身的特征。例如,学者用以分析量刑差异存在的“许霆案”,即使在学术界对定罪与否尚存在较大争论,更别说实务界的量刑。类似个案,甚至不能说明大量的普通案件存在“无期”和“五年”的极端性偏差。我们也注意到,学术界常以山东淄川区法院推行量刑化改革后,所实现的“零上诉、零抗诉”论证量刑指导意见对于缩小量刑差异的关键作用。然而,目前并没有研究成果用客观事实揭示出,山东淄川法院改革前后的量刑差异是否真的有所减少。因此,中国司法实践中是否存在法律无法控制的量刑差异,还是一个未知命题。
二、命题检测:量刑差异能否检验和解释吗?
与裁判量刑活动的过程一样,量刑差异的检测也错综复杂。正如季卫东指出,法官裁判刑罚需考虑法官裁判的法律内事实,而且需要对个案考虑一些特殊性,如政策、利益平衡、受害人需求、预防等各种因素。 事实上,仅从直觉上判断,法官裁量刑罚的过程的确错综复杂。这也就决定了,司法裁判活动的科学性,以及量刑的精准化很难被检测。可能正因为如此,这也是中国刑事法学界并不开展量刑差异和量刑公正检验的原因。然而,我们通过对英文文献的考察发现,量刑差异的检测和定量研究并非不可能,并且已形成了一整套解释量刑差异的理论。因此,对英美国家已经成型的研究量刑差异和量刑公正的方法进行梳理,有助于对中国的量刑差异问题进行尝试性研究。
(一)关于量刑差异能否被检测的问题
在量刑差异的存在性检测上,霍格斯早期从心理学角度指出,量刑程序非常复杂,法官在决定监禁和量刑长度时所考虑的因素较多,量刑差异的客观真实性变得难以信服。 因此,奥斯汀和威廉姆斯后来的研究指出,受量刑情节、量刑客观情况的影响,量刑差异是否存在的检测,以及量刑差异的合法性程度的精确检验变得不可能。 上述二位的研究,的确反映了量刑程序的复杂性,然而这仅是量化研究普遍开展以前的早期结论。一些新近的定量研究提出了新的证据,并由此提出了多种解决和解释量刑差异检测的经典理论。
焦点理论(Focal Concern Theory)提出假设,影响量刑的因素真的不可探测吗? 是否每个量刑因素都要关心呢?回答是否定的。量刑过程中通常有三个关注的内容:(1)罪犯的谴责性或罪责评估;(2)通过剥夺犯罪人的犯罪能力,或者威吓潜在犯罪人保护社会;(3)量刑决定产生的实际结果、社会成本。 阿尔伯尼特基于降低不确定性(Uncertainty Avoidance)的理论,认为真实的量刑决定程序很少达到完全充分掌握案件信息的客观精确程度,因此,在信息不完全的情况之下,减少这种不确定性的方法是借助于习惯和社会结构的理性。法官一般通过开发模式化的反应机制去尝试管理不确定性。这是法官基于自己处理程序中受影响的判断机制,法官们通常基于日积月累的模式,如种族、性别、早期犯罪的量刑结果等去预测未来犯罪活动。因此,在刑事司法系统中判处刑罚,与其他自由裁量权的处理结果一样,是自我满意和简化偶然假设,从而努力实现理性的结果。
与此相关的是霍金斯的经验观察理论(Perceptual Shorthand Theory)。该理论认为,法官的确不可能充分掌握刑事案件及被告的所有信息,从而精确地决定量刑期限。然而,在量刑信息不可能全面掌握的情况下,法官倾向于用多年的经验(stereotype)观察,结合犯罪的危害性和犯罪人再犯倾向,作为量刑的基准(benchmark)决定量刑的长度。
以上理论围绕三个方面讨论:量刑是否需要全面考察被告人的信息,法官是否需要严格按照量刑指南对被告人的量刑做出精确决定,是否允许法官以个人经验结合被告人的人身特性在自由裁量权范围内自由裁量。基于这个立场,法官量刑的个体差异化有其合理原因,毕竟法官的经验判断对不同被告人的决定不一致。由于法官量刑是基于长期经验和以往的习惯作判断,这个立场也成为法官量刑稳定合理性的解释原因。 这从另一个角度解释了,表象或个案所代表的量刑差异,可能在考虑整个案情后并不存在。不过,这个主观评价过程,还是有可能出现不同法官对被告作出不同评判,从而出现量刑差异。 由此,量刑是否真的存在差异,即使有争论也并不奇怪,毕竟可以有不同的解释机制和价值判断标准。
(二)量刑差异的存在性及其解释
从文献来看,即使就美国联邦和地区之间,及其联邦、州内部是否存在量刑差异,结论也并不一致。考特的研究指出,毒品运输犯罪在美国联邦不同司法区以及同一司法区法庭间量刑存在差异。 奥斯汀的研究指出,法庭所在的城乡位置也影响量刑结果从而出现差异,以城市人口居多的法庭处罚时更考虑法律内因素,而主要以乡村位置聚居为主的法庭则受法律外因素影响较大。 吴对美国联邦不同司法区的量刑差异进行研究后,指出不同法庭之间的量刑存在差异。 不过,这些研究所提出的量刑差异,在进一步研究中被解释。安德森和斯伯恩的研究指出,联邦法官虽然表面上量刑有差异,但是这些差异是因为案件类别和犯罪的严重性所导致,他们因此认为联邦量刑并没有失衡,而是与联邦量刑指南趋于一致。
值得探讨的是,美国联邦量刑指南在实践中的作用。文献显示,美国至少有15个州和联邦司法系统已经制定了量刑指南。然而,学术界对美国的量刑指南评价并不高。研究指出,与先前的强制量刑不同的是,这些量刑指南虽然允许法官基于个案的考虑而裁判合理的刑期,但由此造成新的量刑差异。 克莱默和乌尔莫指出,1982年宾夕法尼亚州量刑委员会制定的量刑指南,通过区分重罪和轻罪的违法轻重程度,结合刑事犯罪记录情况,建立多个量刑梯度,并且赋予法官针对个案的自由裁量权,还允许法官在指南幅度下量刑。 斯蒂次和卡博瑞恩在评价量刑指南的作用时指出,联邦量刑指南虽然控制了量刑差异,但并没有消除基于自由裁量权而出现的量刑差异。 即使有量刑幅度限制,如法官在根据案件的特殊情况,判断出联邦量刑指南可能会判得过重或过轻时,可能采取变通措施。
以上信息,反映出学术界对量刑差异存在性探讨的客观认识。研究还指出,不同地区法院之间的量刑存在一定的差异,这与地区文化和法官有关。在进一步探讨法院量刑之间的差异时,犯罪学者在法院间和法官个人内部做了不同的研究。法院间的量刑差异研究指出,不同州以及本州内部的法院之间有量刑差异。 对于法院之间的差异,安德森等认为,不同的社区背景和公诉人的量刑动议实施情况解释了这些差异。 约翰逊的研究指出,法官和不同法庭的社会环境共同决定了量刑差异。 乌摩尔的定性研究进一步指出,不同巡回法院之间在辩诉交易政策和实践,审判后处罚的刑种和刑度,以及量刑严重性的差异决定了不同地区以及当地法庭社区对量刑指南的理解和解释差异,从而导致了量刑的多种结果。 狄克逊等的研究在解释量刑差异时指出,由于受政治、社会和法庭组织特征的影响, 不同法院的价值观和司法信念的不同,出现各种量刑结果均比较合理。
对于法官之间的量刑差异,研究也作了多种合理解释。安德森等对量刑差异进行梳理后指出,量刑结果受法官的个人背景因素影响。这与法官的不同惩罚哲学有关,持报应主义的法官比功利主义的法官量刑更重。 约翰逊等的研究指出,法官在信息资料不全的情况下,经验习惯容易因资料不足而对被告人特征(违法严重性、前科)等作出差异性判断。 除此之外,量刑差异与法官的性别和种族有关,女性法官量刑更重,黑人和白人法官的量刑存在差异。 其他一些研究对法官先前的背景,如公诉人或者律师职业经历,法官职业年限是否影响量刑差异有研究, 但结论不明显。
上述文献考察,的确反映出量刑差异受多种因素影响,法律内和法律外的因素均有。但值得疑问的是,量刑到底受何种因素的影响,这会让量刑变得毫无规律吗?因此,继续对影响量刑的因子进行梳理可以寻找到一些研究的脉络。
(三)量刑影响因子梳理
自由裁量权和量刑幅度,作为法律内因素在学术界最令人担忧。与此相对,法律外的因素,如司法干涉、法官腐败所出现的量刑差异,也是否定量刑公正的重要因子。上述两个方面的因素相结合,也就出现了极端个案的量刑差异。但司法研究并不能受个案影响,司法活动的开展也不能因极端个案的影响而否定一般性。因此,要对影响量刑的因子做出分析,必须借助于大样本的统计观察结果。对若干个定量研究文献分析后发现,量刑主要受如下因素影响:
(1)犯罪危害性和严重性。格雷斯伍德利用佛罗里达的量刑指南和量刑资料,指出犯罪严重程度和刑事记录是影响量刑轻重的主要因素,并且审判模式和性别对量刑也有显著影响。 克莱默等的研究也指出,犯罪类型、犯罪的严重性以及犯罪记录是量刑轻重的影响因子。 里奥纳多的研究显示,犯罪数额并不影响是否监禁的决定,但是犯罪数额的确影响量刑的长度。
(2)前科越多,量刑越重。斯迪芬斯迈尔等利用宾夕法利亚洲的资料研究显示,是否监禁和量刑长度,主要由犯罪行为的严重性和被告人的犯罪前科决定。 里奥纳多和桑珀的研究也显示,量刑差异最主要受刑事犯罪前科、犯罪严重性、有罪答辩等法律内因素影响。 伍德布莱德的研究也显示,法官在量刑时,会考虑累犯的风险,并对有这种倾向的人判处更重的刑罚。
(3)犯罪自白者量刑更轻。研究指出,犯罪自白(自首)、有罪答辩、辩诉交易的开展,有利于法官基于被告人的悔罪态度或降低司法成本,判断犯罪人的危险性更低,从而给被告人判处更轻的刑罚。
(4)社会经济地位越高,刑罚越轻。社会经济地位的影响程度并不相同,肯定者们认为,大量研究已经指出社会经济地位对量刑轻重有影响,呈正相关。 然而,其他研究却指出,社会经济地位对量刑的轻重程度并没有影响。 伍德雷格最新利用辛辛那提2948个被逮捕男性的量刑资料研究显示,犯罪人的社会经济地位对量刑差异的确有显著影响。
(5)女性比男性量刑的刑期更轻。研究显示,性别对量刑结果有差异,女性比男性的量刑更轻。这可归纳为5个重要的原因:(a)家庭原因等实际状态(Practically),(b)保护妇女的侠义精神(Chivalry),(c)妇女比男性实施犯罪的能力更弱的质朴观点(naiveté),(d)女性更容易被改造的经验观察(Perceived permanence of behavior),(e)对于男性犯罪的恐惧和危险性观察(Perception of dangerousness)。女性对于犯罪的恐惧和危险程度倾向于实施更轻的犯罪。
(6)其他影响因子。受害人和被告人之间的关系上,阿尔伯尼特的研究指出受害人的撤诉有利于减轻犯罪人量刑的倾向,但这并没有达到显著水平。 在年龄、种族问题上,法官通常会考虑这些反应并影响犯罪人危险程度的相关因素决定量刑轻重,并因此在不同年龄群体、民族间出现量刑差异。
本部分的外文文献梳理显示,量刑差异及其影响因子的研究非常活跃,这在美国已有将近半世纪的历史。这对中国开展量刑差异的研究有非常重要的借鉴意义,在方法和变量选择上为本文研究的开展提供了支撑。不仅如此,对各种量刑差异的解释,也为论证量刑差异与否存在的合理性提供帮助。因此,无论中国存在或不存在量刑差异,在一个合理限度以内,各种研究结果都可以接受。
三、资料、问题与研究设计
如前述,中国刑事法学界并没有可循文献进行量刑差异的定量研究,这或许受限于资料和数据的获取途径。这也就出现,中国司法界至今并没有对量刑差异的存在性产生怀疑。作为一个研究尝试,我们希望能在探索过程中,客观谨慎地对量刑差异的存在性进行检验,并对影响量刑的因素进行检测。
(一)研究资料
由于目前并无可行的司法数据供研究,因此我们自行采集了四川省德阳市6个基层法院的判决书作为量刑公正的研究样本。四川省德阳市中级人民法院下属6个基层法院,分别是中江法院、绵竹法院、旌阳法院、广汉法院、什邡法院、罗江法院。由于罗江县法院的样本太小且各年度参差不齐,不具有分析意义,我们直接剔除。基于犯罪样本的可比性,我们只对基层法院的数据进行研究,而没有采集德阳中级人民法院的量刑数据。在判决书样本的选择上,我们希望检测2010年最高法院量刑指导意见以及四川省高级人民法院自2010年10月下发《量刑指导意见实施细则(试行)》以后,司法机关的反馈情况。因此,我们以2009年和2012年为分析年份,从而做对比。由于样本量受限,2010年的资料并不适合做两个时间段的研究,2011年的数据资料也不能充分反映量刑意见对法官的指导,故没有选择这两个年度。
在罪名样本选择上,我们先前的研究显示,中国刑事司法实践中常发罪名是盗窃罪、抢劫罪以及故意伤害罪。 因此,基于样本分析量上的考虑,我们仅对上述两个年份的盗窃、抢劫和故意伤害罪判决书进行收集。在样本数据录入方面,我们参考文献梳理所发现的影响量刑和检测量刑差异的多个变量,编码录入数据,形成分析数据库。 表1是各基层法院样本、年度的分布情况。
(二)研究问题与设计
在本研究中,我们的研究问题为:(1)法院间的量刑是否普遍存在差异,这个问题可以作为检测中国法院间的量刑存在差异的方法尝试;(2)如果有,这些量刑差异因受何种因素影响,这可为未来中国刑事司法实践中减少量刑差异提供证据支持;(3)法官量刑期限受何种因素影响,这可结合外国研究的状况研究中国法官的量刑考虑因素。
1.数据整理
在检测量刑差异的样本时,我们以个罪的宣告刑作为分析样本。样本量有限,且涉及个罪和数罪问题,我们没有对涉及共同犯罪的合并执行刑期进行研究。在分析各法院之间的量刑是否存在差异时,我们首先借助于一元方差分析(Oneway),直接对不同法院的量刑平均值作比较。考虑到方差分析所需要的两个重要条件是,满足方差齐性和正态分布假设。 因此,在分析法院之间是否存在量刑差异时,我们对数据做了幂阶梯转换(Ladder)。数据转换虽然有犯第一类型或第二类型错误的风险,但是这种处理是统计分析中的常用手段。仅以本文量刑差异的研究主题为例,多个分析文献显示了对数据以对数转换处理。 我们注意到,由于样本数量可能不足,数据转换可能改变原有数据反映出的信息。因此,在进行方差分析时,也对原始数据做了比较。
在分析对象上,我们分别对2009年、2012年的量刑数据作分析,并将两年的数据合并到一起检测不同法院的量刑差异。研究已经指出,量刑并不呈标准正态分布,而是近似于泊松分布。我们在对宣告刑作探索性分析时也发现,数额较大(定罪标准)的盗窃罪宣告刑聚集较多,而数额巨大(加重条款)以上较少,因此我们对宣告刑按不同数额分段处理。2010年四川省量刑指导意见规定,德阳市盗窃罪数额较大标准为700元,数额巨大标准为7000元,数额特别巨大的标准为5万元。 如表2所示,我们将盗窃罪数额作为变量控制标准,按不同组分别进行比较,并对数据进行相应转换。由于在盗窃700-7000元段,宣告刑数据转换后满足正态分布假设的转换模式不一致(对数 Vs 平方根倒数 Vs 平方根),因此我们在探索性分析后,仅将700-2000段的宣告刑按平方根倒数(1/Sqrt)转换后作为分析对象。抢劫罪的数据转换比较理想,因此分析过程中直接以对数转换即满足正态性假设条件。类似的道理,故意伤害罪的量刑转换后接近于正态分布,这基本上可以做量刑比较。尽管故意伤害罪的转换标准并不统一,可能存在方法瑕疵。然而,如表3所示,故意伤害罪的量刑因方差齐性假设的违反,也并不适合做组间比较。
2.分析方法
在完成数据转换后,我们结合转换后的数据首先进行了方差齐性假设检验(Bartlett's test for equal variances)。如表2所示,不能拒绝不同法院在各组间的量刑满足方差齐性假设的只有2009年的(700-2000元)组(带“√”)。方差齐性假设作为方差分析的条件之一,这使得本文的研究结论较苛刻。然而,如果不满足方差齐性假设条件,不同组间的变异程度不同,这容易使平均值比较犯错的可能性更高。
由于一元方差分析的结果是任意两个组别的差异,这就意味着只要有一组法院比较出量刑差异,那么整体量刑比较均会出现差异的显著结果。如果仅以此得出结论,那么就可能忽略其他组比较,也不能看出量刑差异是普遍情况,还是个别情况。因此,在进行方差分析时,我们使用多组配对比较(Scheffè multiple-comparison test)。 据此,不仅可以分析是否存在量刑差异,而且可以发现量刑差异存在于哪些法院间。
为了检测和分析影响量刑的因子,我们在后文中使用了多元方差分析(MANOVA)和多元线性回归(Ordinary Linear Square Regression)。在进一步探索造成量刑差异的原因时,我们还对总模型进行了分解。方差分析,可以看出各变量对量刑差异影响。回归分析,有助于理解量刑的影响因子以及差异在不同法院之间的水平大小。文献梳理过程中,我们发现各种分析量刑差异的方法,主要是线性回归或逻辑回归(Logistic Regression), 在大样本分析模型中还有少量研究使用HLM和Multilevel Modeling来分析法院之间的量刑差异。按照我们的设计,量刑期限以月为单位,作为连续变量处理自然没问题。最令人迷惑的是,五个法院基层法院盗窃罪(sktest,Pr(Kurtosis)==0.000, P==0.000)、抢劫罪((sktest,Pr(Kurtosis)==0.001, P==0.000))、故意伤害罪(sktest,Pr(Kurtosis)==0.000, P==0.000)量刑结果并不符合正态分布的假设,这在统计模型的前提上自然存在一定的争议。然而,量刑差异在方差分析中已经基本解决,多元回归模型的目的是为了寻找到影响量刑以及对量刑差异起作用的因子,因此,这基本可以作为发现一些显著影响因子的方法。
表3是多元回归模型中使用的变量,选择这些变量的原因是基于文献发现。量刑期限作为因变量,中江法院作为检测是否存在量刑差异的参照,分别和绵竹法院、旌阳法院、广汉法院、什邡法院相比较。同时,为了考察2010年最高人民法院和四川省高院量刑指导意见对五个基层法院量刑的影响,我们将2009年设置成比较的参照年份,从而看2012年与其出现差异的情况,从而检验2012年的量刑指导意见。在进一步分析量刑的影响因子时,我们将犯罪人的性别、户口、年龄等身份特征加入到控制变量中,同时对表征犯罪严重性的犯罪数额,伤害程度, 以及受害人性别(不考虑男女共存)、受害人个数,犯罪是否完成等作为检测这些变量对量刑差异的显著影响。尤其是,我们将代表犯罪人人身危险性的前科次数作为影响量刑因子的重要控制变量。在检测受害人的悔罪态度时,我们将自首和坦白与没有这些情节的犯罪作比较,从而检测这些情节对犯罪的影响。同时,将赔偿受害人与否,也作为检测受害人积极赔偿对于量刑的作用,没有任何赔偿的作为参照。在犯罪原因上,我们将一般犯罪作为参照,分别将迫于生活压力、临时起意、预谋犯罪、仇恨报复等代表犯罪人主观恶性的变量作为考察犯罪人刑罚轻重的虚拟变量组做比较。基于已有研究提出,中国的羁押期限较长,我们欲对犯罪轻重和审判周期长短的关系进行检测,从
而发现是否量刑更轻的犯罪审判周期更短。 与此同时,我们将审判程序设置为虚拟变量,简易程序作为参照,探讨同等条件下简易程序和普通程序的量刑区别。基于已有研究指出,律师在量刑方面所起的作用甚微, 因此我们也想检测下律师参与辩护是否可以降低被告人的处罚。
毫无疑问,从观念上来看,不确定性理论可能更有说服力,因为影响法官量刑的因素错综复杂,难以做出绝对精确的研究。然而,法官量刑的确可能基于一种习惯和法庭社区氛围,从而在大量的量刑经验中总结出一套适用的方法。况且,社会科学并非火箭科学,我们基于文献考察后引入若干控制变量也仅是作些初步性探索研究,更进一步的努力我们将考虑更多的因子。
四、研究发现与讨论
(一)法院间量刑差异
1.五个法院整体观察
表4是五个法院整体量刑比较的差异结果,此表所表示的是:是否这五个法院中有任意两个法院的量刑存在差异。从各组间的平均值来看,五个法院的量刑似乎都存在一定差异。以盗窃数额700-2000元为例,五个法院2009年和2012年的所有量刑的平均值是8.15个月。中江法院两年的平均值是7.93个月,而绵竹、旌阳、广汉、什邡的平均值是6.64个月、8.36个月、7.08个月、9.15个月。从数据结果来看5个法院的的确存在一定差异,然而,这种差异并没有达到显著程度(F=0.58,P=0.68)。严格意义上说,这个比较可能不妥,因为五个法院量刑之间的方差齐性并不成立【Bar Chi(2)=54.40,p=0.000】。因此,很难准确地说明,五个法院2009年和2012年之间的量刑存在差异。
如表4所示,方差齐性假设检测反映出适合做法院间作比较是:
(a) 盗窃罪2009年的700-2000元(平方根倒数转换)
(b) 盗窃罪2009年7000-5万元(平方根转换)
(c) 盗窃罪2009年和2012年5万元以上的整体观察(原始数据)
(d) 盗窃罪2009年和2012年5万元以上的整体观察(平方根倒数转换)
(e) 盗窃罪2012年5万元以上的观察(原书数据)
(f) 盗窃罪2012年5万元以上的观察(平方根转换)
(g) 抢劫罪2009年和2012年的整体观察(原始数据)
(h) 抢劫罪2009年观察【原始数据(Bar Chi2=8.18,P=0.085)】
(i) 抢劫罪2009年观察(对数转换)
结合表2正态分布假设检验结果,最准确的量刑差异检测项目应当是(a)、(f)、(i)。
不妨以2009年抢劫罪为例,五个法院2009年抢劫罪的量刑平均是46.38个月。中江法院两年的平均值是42.33个月,而绵竹、旌阳、广汉、什邡的平均值是114个月(样本=2)、52.8个月、38.71个月、54.3个月。从F值来看,5个法院的量刑数据的确存在显著差异(F=2.67,P=0.037)。然而,由于正态性假设不成立,这个结论存在极高的错误可能性。将量刑取对数转换后进行数据转换,充分印证了抢劫罪之间五个法院的量刑并没有显著差异
如果不考虑方差齐性问题,2009年各法院在故意伤害罪的量刑可能不存在差异,但是2012年的量刑原始数据出现差异。但我们并不愿意轻易下此结论,因为不同年份和两年的整体数据都表明F检验违背了方差齐性条件。但无论怎样,我们倾向于认为,就故意伤害罪两年的整体情况来看,五个法院之间并不存在太多差异。
从表4中2009年和2012年的量刑情况来看,各法院的量刑平均值并没有发现有显著的共同趋势。盗窃罪、抢劫罪、故意伤害罪中各年份的量刑平均值没有发现有减少,与之相反,故意伤害罪2012年的量刑比2009年更重。对于这个问题,不妨用犯罪稳定理论做些探讨,在各法院每年的犯罪基本上没差别的情况下,故意伤害罪2012年的量刑可能比2009年更重。同理,我们发现2012年中江法院的抢劫罪量刑比2009年更重,平均值相差11.11月。 不过,由于涉及伤害程度和抢劫数额的差异,这个结论的真实性将在多元回归模型回答。
如前述,即使各法院存在量刑差异,但是我们并不清楚差异是由某一法院引起,还是多个法院出现差异的共同趋势。因此,下文将继续借助于 Bartlett 组间比较进行分析。
2.法院间Bartlett Scheff多组比较
如表5所示,我们将各法院直接按两两配组后比较后,基本没有发现各法院组间有显著差异。例如,2009年中江法院和绵竹法院在盗窃犯罪上,量刑的平方根倒数相差0.04(注:原始数据量刑显示,绵竹比中江法院量刑多1.05个月)。与此相反,旌阳法院、广汉法院、什邡法院的量刑稍微比中江法院要轻,但无论如何都没有达到显著水平。就其他盗窃罪来看,情况大致相同。存在差异的是,2009年盗窃7000元至5万元的量刑,旌阳法院和绵竹法院存在显著差异(P=0.029)。从量刑的平方根来看,显示旌阳法院比绵竹法院重1.59,原始刑期显示二者之间相差20.2个月(见表4)。但这个结论需谨慎对待,因为绵竹和旌阳2009年盗窃7000—5万的犯罪在样本上相差20个(27 Vs 7,见表4)。总的情况看,我们在2009年盗窃罪中,并没有发现其他几个法院组有差异,这个状况在相似样本上非常明显。例如,盗窃7000-5万元的犯罪中,2009年和2012年中江法院和绵竹法院都是41个调查样本,二者之间的量刑分别是32.34月 Vs 35.95月(表4),二者之间的量刑差异不显著。再如,2012年盗窃5万元以上的犯罪,中江法院和旌阳法院的样本都是7个,二者之间的量刑分别是119.21 月 Vs 121.86 月,原始数据量刑不显著仅相差2.6月(p=1.000),数据转换后二者之间的平方根相差0.24(p=0.999)。
2009年的抢劫罪之间似乎存在量刑差异,然而,抢劫罪各法院间的样本差异较大,并不能得出有效结论。值得说明的是,2009年样本量大致相当的广汉和什邡法院(20 Vs 14),原始数据显示相差15.59个月(p=0.784),然而差距并没有达到显著水平。即使将量刑取对数转换,二者之间的差距变为0.283,但仍然无法得出显著的量刑差异结果(p=0.782)。进一步值得说明的是,不考虑方差齐性前提条件下,2012年中江法院和旌阳法院之间的量刑差异的确非常明显,原始数据相差-16.53月(p=0.21),但对数转换后二者之间的对数差距为-0.53,并且达到显著水平(p=0.003)。这个问题的可能解释是,2012年的量刑指南按照
不同情节使用百分比减刑,可能在某种程度上打破了法官量刑的既定习惯,从而在数学量化的选择比例上出现差异。 当然,这只是我们的一种假设,毕竟这种分析的前提——方差齐性已经违反。然而,这些解释仅是一种可能,还有犯罪数额以及其他案件的特殊情况没有考虑,依然需要多元回归量刑模型解释。
(二)多元回归模型:量刑差异及影响因子检验
表6是多元方差和线性回归分析模型的最终结果,后文中将进一步展示各变量对量刑及量刑差异的影响。F值和决定系数R2显示,方差和多元回归分析模型非常有效,分别解释了盗窃罪74%、抢劫罪75%、故意伤害罪54%的量刑差异。不可否认,R2还说明另外一个重要信息,尚有若干影响量刑的未知因素没考虑进去,尤其是故意伤害罪的可探索变量更多。
如表6所示,在大样本分析模型下,方差分析和多元回归模型均显示四组法院比较中只有一组法院有差异,剩下的三组法院量刑均无差异。这进一步说明,我们在一元方差分析模型得出的结论基本成立,法院间量刑差异并不普遍。控制所有解释变量后,盗窃犯罪广汉法院的量刑平均水平上比中江法院高7.82个月,抢劫罪中江法院比旌阳法院高31.14个月,故意伤害罪旌阳法院比中江法院高92.18个月。
从解释或控制变量的分析角度来看,模型也探索到影响法官的若干重要影响的因子。就各影响因子来看,回归系数(Coef.)和标准化系数(Beta)说明了各变量对量刑和量刑差异的作用大小。盗窃罪量刑主要受犯罪人年龄、犯罪数额、前科、犯罪动机、犯罪自白、自我聘请律师、审判周期、审理程序所影响。抢劫罪主要受犯罪人年龄(p=0.087)、犯罪数额、自我聘请律师、从严处罚情节影响。模型中纳入的故意伤害罪量刑影响因素较少,法官量刑主要受被害人的伤害程度影响,受伤人数也是一个重要参考因素(p=0.088)。
(1)犯罪人身份特征。从犯罪人年龄来看,年龄越小的财产犯罪人所得到的处罚更轻,平均每增加1岁,盗窃罪刑罚增加0.21月(6天),抢劫罪刑罚增加0.66月(22天)。这可能与低龄青少年的容易越轨和法律对未成年人的从轻处罚倾向有关。 我们并没有发现,男性犯罪人和女性犯罪人的量刑有差异,农村人口与城市人口之间的刑罚有差异,文化程度的高低对于量刑没有影响。
(2)犯罪危害性与严重性。模型显示,犯罪数额是法官量刑考虑的重要因素,数额每增加1000元,盗窃罪量刑将增加0.47月(14天),抢劫罪量刑将增加2.45月(73.45天)。四川省2010年颁布的量刑指导意见,也按照犯罪数额与量刑的积极关系进行指导。 前科对盗窃罪影响较大,平均每增加一次盗窃前科次数,量刑将增加2.36月(70.8天)。前科和犯罪数额,代表了犯罪人犯罪习性和犯罪严重性,这两个因素对财产犯罪的影响说明法官的量刑结果符合常理。即,犯罪越重的人,社会危险性越高的人,刑罚越重。故意伤害罪的危害性反映在致人伤害程度上,这与中国刑法对不同伤害程度的量刑幅度设置有关。 模型显示,伤残等级每上升一个(如:轻伤→重伤),量刑将增加12.23月,这和常理比较一致。模型也显示,受害人性别对量刑并没有影响。
(3)犯罪原因。预谋犯罪对盗窃罪的量刑处罚影响较大,与没有这些情节的犯罪人相比,预谋性盗窃犯将多判处7.68个月的刑期。 模型中没有发现迫于生活压力的生存性犯罪者获得更低刑期的显著性,是否偶然发生的临时起意犯罪也没有发现对量刑有影响。
(4)犯罪自白。犯罪自白对于盗窃罪的量刑有影响,自首者的量刑宽宏程度比坦白的宽宏更大。与没有这些情节的犯罪人相比,自首者的量刑将减少11.8月,坦白者的量刑将减少7.72个月。 模型也显示,犯罪自首对于抢劫罪降低刑期有一定影响趋势,但没有达到显著水平。然而,对于具有严重社会危害性的犯罪,自首或者坦白对故意伤害罪的量刑并没有太大影响。
(5)主动赔偿。主动赔偿对盗窃犯罪者来说较为有利,主动赔偿者的量刑比没有赔偿的人的量刑将减少4.43月。但是赔偿对于抢劫和故意伤害等严重犯罪来说,并没有太大意义。
(6)辩护人效果。聘请律师作辩护,这是多数犯罪人希望用法律手段维护权益的做法。模型显示,刑事诉讼中律师辩护起了较大作用,犯罪人自己聘请律师的辩护效果最好。 与先前研究所指出的律师作用不强相比,我们的研究指出律师在刑事诉讼中发挥了重要作用,在控制相关变量后,聘请律师的犯罪人比没有律师的犯罪人所判刑期更轻。 盗窃罪中,犯罪人聘请律师作辩护人比没有律师的人将少判7.21月,抢劫罪聘请律师的比没有聘请的少判17.83月。财产犯罪中,法律援助律师没有为被告人的刑罚带来显著效果,与那些聘请律师的犯罪人相比,法律援助律师的效果明显不如聘请律师。
(7)量刑情节。模型显示,从宽处罚和从严处罚对犯罪人的量刑作用呈鲜明对比。从严(从重处罚)处罚对犯罪人的量刑影响更大,抢劫罪模型显示,具有从严处罚情节的罪犯将多判24.16月。遗憾的是,从轻处罚并没有为犯罪人带来显著性的刑罚优遇效果。这可能与量刑活动中并没有充分考虑从宽情节所应该具有的刑罚宽宏,尽管判决书上明确说明从轻处罚。“从轻处罚”只具有文本效应而无刑罚效应,这和我们早期的理论分析一致。
(8)审判活动。审判周期对量刑的影响反映出一些乐观信息,量刑的长度与审判周期呈正相关,平均每延长100天,量刑将增加9个月。这与犯罪的严重程度有关,按常理,犯罪越重,审理周期越长。我们在模型探索过程中利用Pearson相关系数探索发现,财产犯罪的数额与审理周期在10万元以下相关系数达0.414(P=0.000);故意伤害罪的伤害程度与审理周期的模型也显示,相关系数为正(r=0.06,p=0.49)。模型也显示,适用普通程序所判处的刑罚更重。审判程序对量刑有重要影响,中国刑事诉讼法已经在适用简易程序和普通程序上的可能刑罚效果上做了明文规定。简易程序适用于可能判处三年以下有期徒刑的犯罪,盗窃犯罪的“数额较大”量刑梯度是三年以下有期徒刑、拘役、管制,“数额巨大”以上的量刑梯度才是3年以上10年以下。这自然解释了,为什么盗窃犯罪中适用普通程序的人将比适用简易程序者将多判11.88月。故意伤害罪也显示了类似趋势,适用简易程序审理的案件有量刑更轻的趋势。
Beta标准化系数反映了上述各影响因子的作用,影响盗窃罪量刑排名前三的依次是犯罪数额、审理程序、犯罪前科,这说明法官在盗窃罪中非常重视犯罪的社会危害性大小和再犯倾向。审理程序的重要性,这主要表现为犯罪数额决定了量刑轻重的可能性,我们在初始模型的探索过程中发现,盗窃7000元以下占了69.73%,这就说明轻罪盗窃是司法实践中的主要犯罪类型。抢劫罪排名前三的依次是,犯罪数额、从严处罚情节、律师辩护,这同样是犯罪严重性的表现。中国刑法规定抢劫罪的起刑是3年,而抢劫罪的加重处罚条款中有8个加重情节。
(三)量刑差异原因解释
量刑结果和量刑差异是如何做出的呢?上文已经指出,盗窃罪量刑在广汉法院和中江法院可能出现差异,抢劫罪和故意伤害罪量刑在中江法院和旌阳法院可能出现差异,但其他法院间的比较并未发现类似结果。直到目前为止,我们也还未对法院间的差异进行解释。本部分将表6的多元回归模型,分解成多个回归模型,看不同变量如何影响法院之间的量刑。
如表7所示,回归分解模型为量刑差异寻找到部分原因。总体来看,犯罪数额、前科、律师辩护、量刑情节、审判模式是引发量刑差异的重要原因。以盗窃罪为例,在控制审判程序后,中江法院和广汉法院的量刑差异开始出现量刑差异,而之前中江和什邡法院之间的量刑差异得以消除(模型一至模型十)。这可能和中江法院审理的盗窃犯罪以普通程序审理有关(83.54%),什邡法院有40.74%的案件、广汉法院有37.04%的案件是通过普通程序审理。如前十个模型所示,中江法院的盗窃罪量刑一直比什邡法院高。当控制审判程序后,模型十一和模型一相比,减少9.8个月的量刑差异(-12.8+3.0),并且这种差异不再显著。按照中国刑事诉讼法规定,简易程序审理轻微刑事案件,主要是可能判处3年以下有期徒刑案件,而普通程序则是审理严重犯罪,并有可能判处3年以上刑期。这就是模型十和模型十一比较,显著差异的两个法院变化的原因。
同理,对比模型三与模型四,仅控制犯罪数额后就解释47%的量刑差异(r2=0.52-0.05)。并且,控制数额后,中江法院和什邡法院的量刑差距逐渐缩小(对比模型一、四、十)。因此,我们在对数额分布列联表检查后发现,7000元以上的案件中江县法院分别是37.2%,什邡法院是24.63%,广汉法院是26.25%。13%的犯罪数额分布差距,是造成量刑差异的重要原因。不过,这个解释对于改进中国的量刑处理程序并没有多大意义,因为犯罪数额的分布具有随机性。
在前科的考察过程中,我们发现中江法院的前科平均次数比什邡法院低0.04次。如前述逻辑,前科次数越多,刑罚越重。这就是为什么模型五控制前科次数变量后,中江法院和什邡法院的量刑差距扩大0.48月的原因(10.85-10.37)。与犯罪数额一样,前科具有随机性,按照犯罪人人身危险性量刑自然没有问题。类似问题,我们也发现从严处罚、自我聘请律师、法律援助律师在中江法院和什邡法院之间相差5%、12%、9.5%。因此在控制这几个变量后,什邡法院和中江法院之间的量刑差异缩小2.11月。我们在其他变量的回归模型探索中仍然有类似发现。
抢劫罪各法院之间的量刑差异解释稍微复杂,因为不仅法院之间的差异存在交替现象,而且最终的模型十一和模型一相比,控制若干变量后,中江法院与旌阳法院的量刑差异反而相差25.32月(31.14-4.82)。对比模型一和模型二中各法院之间的量刑差异情况,我们发现2012年后法院之间的量刑差异反而扩大,这进一步说明量刑指导意见发挥的作用有限。中江和旌阳法院犯罪数额平均值相差3816.3元(7491.8-3675.5)的事实,解释了为什么控制犯罪数额后解释了33%的量刑差异。类似情况同样出现在前科、量刑情节、律师聘请、犯罪自白变量上。总的来说,多元回归模型的解释功能从6%上升到75%,表明我们的确解释了大量造成法院间量刑差异的多种因素。
回归分析模型也间接支持表4所反映出的信息,2012年的量刑比2009年量刑更重(模型二至六)。至于模型十一显示的中江法院和旌阳法院依然存在的量刑差异,可能还有其他
变量影响法院之间的量刑差异,如法官态度、法律理解、公诉人作用等因素,这需要将来的研究继续展开。在逐步探索过程中,我们发现伤害程度和受害人个数解释了23.5%的中江法院和旌阳法院之间的量刑差异,其次是从严处罚(5.7%)和赔偿受害人(4.8%)。
总的来看,我们的分析和最高人民法院颁布的《人民法院量刑指导意见(试行)》四川省高级人民法院颁布的《量刑指导意见实施细致(试行)》逻辑一致。诸如前科、犯罪数额等也与常理相符合。就量刑差异存在性问题上,我们的确发现每个罪名有一组法院可能存在量刑差异。然而,对于这个结论的普遍性来看,因数据所限,本文并没有发现非常普遍和相差悬殊的量刑差异。未来一段时间内,我们将拓宽调查样本、增加变量收集等措施作进一步检测。
五、讨论与结论
中国刑事司法中的量刑差异是普遍现象吗?本文通过对最近20年的量刑差异研究进行梳理后,发现中国学者普遍认为存在严重量刑差异仅是对极端个案分析后得出的结论,这些循环往复的理论研究并没有定量研究和分析技术支撑。基于这个发现,本研究借助于梳理英美国家最近几十年发表的量刑差异文献,寻找国外量刑差异是否可检测,以及目前的理论现状和解释量刑差异的影响因子,并在此基础上设置检测中国量刑差异的多种分析变量。
本研究利用德阳市5个基层法院的盗窃罪、抢劫罪、故意伤害罪的1039个量刑判决书样本,借助于方差分析和多元回归分析后,没有发现有力的证据说明5个法院间都存在显著性的量刑差距。回顾本文,我们得出如下结论:
第一,从量刑平均数来看,五个法院的平均量刑存在直觉上的差异。但在进行正态分布和方差齐性验证后发现,仅从平均数得出法院间存在量刑差异并不科学。
第二,一元方差分析和多组配对比较方差分析显示,量刑差异只是个别现象。多组转换数据和原始量刑数据的一元方差分析以及多组配对比较的方差分析模型显示,只有旌阳法院和绵竹法院间存在量刑差异,其余三组法院以及在其他犯罪中旌绵之间不存在差异。
第三,多元方差和回归分析模型显示,控制若干影响量刑差异的变量后,法院之间的差异并不普遍存在。盗窃罪在中江法院和广汉法院之间,抢劫罪和故意伤害罪在中江法院和旌阳法院之间存在显著差异。
第四,回归模型显示,量刑的影响因子并非错综复杂而不可检测。盗窃罪量刑主要受犯罪人年龄、犯罪数额、前科、犯罪动机、犯罪自白、自我聘请律师、审判周期、审理程序所影响。抢劫罪主要受犯罪人年龄、犯罪数额、自我聘请律师、从严处罚情节影响。故意伤害罪受被害人的伤害程度影响。
第五,多元回归分析模型,解释了法院之间的量刑差异的原因。不同法院犯罪数额的分布的差异,以及普通程序和简易程序之间的适用差别,解释了为什么什邡法院和中江法院之间的量刑差异。财产犯罪之间的量刑差异还与从严处罚、犯罪前科、犯罪自白、律师聘请有关,伤害程度、赔偿受害人以及从严处罚的应用等说明了这些变量解释了法院之间可能的量刑差异。
第六,研究也揭示,各种量刑影响因子的适用差异。法官在量刑活动中对刑事法规定的量刑影响因素上存在偏好,法官心理上更容易选择从严处罚(从重处罚),而从轻处罚或减轻处罚实质上并没有降低犯罪人的处罚。法庭审理案件的程序需要严格管理,选择适用简易程序和普通程序的条件应该固定下来。专业律师在中国刑事审判活动中发挥较大作用,律师辩护有效减轻了被告人的刑期。
第七,对比2009年和2012年的量刑数据,我们发现量刑指导意见对法官量刑所起到的作用非常有限。盗窃罪和抢劫罪中,法院之间的量刑差异显著性被扩大,故意伤害罪也呈现出同样趋势。
本文发现四川省德阳市五个法院之间的量刑差异并不普遍,可以借助于社区理论来解释。由于五个法院之间相隔较近,社会文化环境相似,法官所受的地域和政治影响、价值观、选任培训等因素均比较接近。 德阳市中级人民法院与下级人民法院的刑事审判活动交流比较频繁,并定期开展法官专项培训活动,这一定程度上为统一量刑尺度,避免下级人民法院刑事量刑的随意化而出现大量差异发挥了一定作用。至于2010量刑指导意见对法官的量刑指导有限,这有两个解释可能。第一种是,借助于经验观察理论来解释,部分法官量刑受多年习惯和经验影响所形成的量刑直觉判断在短时间内没有被完全消除,从而出现量刑差异扩大的趋势。第二种解释是,借鉴美国联邦量刑指南实施后的教训,2009年德阳地区法官因相似的背景和习惯导致量刑上的一致,而量刑指导意见打破了这种因习惯所形成的均衡,从而出现新的量刑差异。不可否认,还有第三种可能是,受2012年和2009年样本总量上的差异影响,我们揭示出与真实情况不一致的结论。
本文以德阳市为视角观察中国的量刑差异,同样可能犯以偏概全的错误。但受限于目前国家层面的数据无法获取,因此管中窥豹还是可见一般。社会科学研究,数据分析并不能精确揭示出所有客观事物之间的关系。与此相似,量刑差异和量刑公正的研究,也不是一篇文章所能解决。尤其是对于不同地区的量刑差异检测和研究,还需要继续探索。正因为上述多种迷惑,我们将继续运用更优的定量分析方法,还将借助于定性研究检验并推广本文的结论。基于此,作者持开放态度,欢迎广大学术同仁批评指正。