《智能辅助：AI下民商事办案系统的建构》-法学论文，法律论文-论文范文参考-科学狗论文网

标题

智能辅助：AI下民商事办案系统的建构

范文

蔡一博

内容摘要：目前AI与法律结合的研究处于蹒跚起步阶段，该领域文献综述与研究滞后于系统研发，为更好地对司法科技进行有效地能动回应，立足实证研究，总结现有系统研发的瓶颈问题，并站位于法院系统内的开发者、裁判者、使用者的三重身份提出以法官的裁判思维与要件标注的方法来审视现阶段的应用成果。首先，以场景需求为导向，在法学、计算机的理论支撑下构建AI下民商事办案系统，并补强实践短板，使办案系统后期具备深度学习能力。在路径依赖上，运用“开放结构”法学理论对类案场景模式下的裁判思维进行建模。其次，采用专家经验提取案件要素和证据规則，通过大量的人工化的要素标注建立起标签体系夯实数据基础，提高案件自动标注能力。最后，通过数据的机器学习、优化、迭代，最终实现机器对法律各领域的自主学习功能，实现民商事办案系统的智能化。

关键词：人工智能民商事系统裁判思维要件标注

数据由法官创造，AI办案系统的开发应以法官的需求侧为设计进路，法官的亲历性决定其深度参与研发才能让AI更好地服务于审判。

——题记

信息化、智能化建设系智慧法院建设中牵一发而动全身的“牛鼻子工程”，是进一步推进和落实司法体制综合配套改革精神的“现代”助推器。过去数十年来，S市法院的信息化建设工作将案件基本信息、流程管理信息等进行有机统合，而且在AI 〔1 〕与法律结合的辅助办案系统方面进行大胆探索，扎实推进，比如“以审判为中心的刑事诉讼制度改革软件”的开发取得初步成效，并得到中央政法委的肯定。同时，G省模式和Z省模式在智能辅助办案系统方面也卓有创新。但是，目前三省市的智能辅助办案系统基本限于刑事领域或极特定的民事领域，鲜有大范围、标准化、系统性地对民商事案件智能辅助办案系统进行深度研发。笔者立足于推进智慧法院这一重大课题的背景下，利用好现有大数据资源、已有的法学理论研究成果和日趋完善的AI模型算法，通过横向对案件标准化要件提取与标注、纵向对裁判思维的梳理与整合等进行多重维度的深挖以构建民商事案件智能办案系统。为该领域具备深度学习功能打下坚实的基础，以此促进审判体系和审判能力现代化、破解案多人少的矛盾、实现简单案件智能力。一、现象观察：系统的实证分析

国内关于AI与法律融合的各种研究孵化成果并不丰富，〔2 〕甚至有应用成果倒逼理论研究之势。相关内容的模型实用性不强、建模系数提取的合理性不够，真正将计算机技术、裁判思维与法学理论结合起来的模型不多。〔3 〕虽然S市和G省模式下的刑事领域已进行系统性的研发，但是民商事领域因覆盖面广、类型复合高、类案差异性大等特点鲜有深入研发，目前呈碎片化、分散式研发态势。比如S市高级人民法院开发的知识产权民事侵权案件赔偿数额专题分析系统、G省研发的道路交通事故损害赔偿系统等。我们通过实证分析、走访调研和理论分析三个角度对已有系统进行述评以明确研发难点和重点，为下一步大范围、深度化研究指明方向。

（一）宏观视角：系统述评

1.供给层面的述评。目前而言，法院系统内部的S市模式和G省模式在办案系统方面最具代表性，但是两个系统的特色各有不同，S市偏向于办案系统在贯彻证据规则，统一法律适用上起到智能辅助作用，而G省偏向于办案流程智能化管控。G省刑事模式的优势在于各单位专网整合早，数据利用的整合能力强，但是系统适用范围相对较窄，仅针对十余类刑事案件的裁判文书进行梳理分析，并且主要提取量刑要素分析处理；应用效果和部门协调应用有待提升；辅助法官制作裁判文书方面功能较弱。〔4 〕上述研发虽是刑事领域的内容，但是对于民商事案件智能辅助办案系统在办案流程规范、网络建设平台、建模算法等方面具有启发性。比如，通过刑事领域的建设，S市法院系统在数据采集、存储、分析、可视化等多个基础性技术领域已经取得较大的突破，形成了实用性强、稳定度高的技术能力，整体技术体系已初步构建完成。

虽然国内外部分软件已取得较好成效，但是存在研究领域过于集中（刑事案件领域、民事案件领域中的合同文本自动生成及部分内容可视化表达、智能类推等）、研发深度浅、实际应用少、覆盖面窄等不足。同时，国外的系统大多系服务市场的律师事务所研发，与法院系统的需求点有所不同，所以应扩大研发领域，并明确研究方向，只有将占案件总量85%的民商事案件进行深度研发，明确用途为辅助办案系统，才能切实做到为法官减负、达到服务诉讼当事人的美好愿景。但在研发的过程中应立足民商事案件的本质规律进行科技能动的系统研究，将产品目标琢磨透，从而有利于办案系统的深入研究和持续应用。

2.需求层面的问题。（1）开发应用与实际需求存在偏差的主要原因系需求分析的产品负责人对于法律和一线办案人员所需不甚了解。以笔者经验，如果该项工作的起步存在偏差，后期研发难度和应用适宜度将大打折扣，我们必须重视此项工作。所以笔者提出数据由法官创造，“智能辅助”的办案系统开发应以法官的需求侧为改革进路，让法官深度参与研发才能让AI更好地服务于审判。我们在提出产品需求的同时一定要抛弃传统的纯文字表达方式，争取利用文字说明与思维导图相结合的方式进行充分的可视化表达。（2）关于研发数据的数量和质量问题系事关AI能否有效开展研究的基础性工作，因为现有法律数据大多是非结构化数据，将此类数据有效的转化为准确和可理解的数据需要标注工作科学化。尤其是民商事案件诉请内容复杂、证据形式多样，该部分既是供给需求层面问题，也是运行中的最大障碍之一。未来的发展方向将主要集中在非结构化数据的标准、快速的提取方面，大量存在的非结构化数据和半结构化数据带来的技术和应用领域是大数据的蓝海，多样类型的数据分析、复杂的数据组合、多源的数据融合等问题将成为创新的重要聚焦点。上述两部分内容的解决方法后文会予以实操演示。

（二）微观聚焦：运行问题

现阶段各项办案系统的运行远没有达到人们预想的实用结果，从法律角度看其主要原因是系统的开发者对法律问题还不太熟悉，没有将法学理论的方法引入这些系统开发。〔5 〕同时对数据未进行有效法标化、推理建模算法不成熟等问题是给我们法律工作者和技术研发者提出的棘手课题。

1.系统数据表达的非标准化。研发系统的成功很大程度上需依赖于自然语言理解研究工作的突破。之所以目前困难重重，首要原因是法律实务中专业术语使用混乱。〔6 〕术语非标化问题的根源在于理论与实践在某些表达方面存在脱轨，这种脱轨不是不可以避免的，通过同类案件中对高频词汇进行统计后统一同一内涵的语词作为备注库可解决技术分辨的问题。其次除术语非标化外，法律文本或者裁判文本的系统数据标注化建设严重滞后，针对此种非结构化的内容我们要时常进行类案语言的标注工作。更重要的是希望有关部门能够贯彻、落实好“关于进一步完善与推广最高法院2015年法標规范工作”的指导意见。

2.系统逻辑建构的不确定性。现有各种系统难以突破的热点问题，即法律推理的认知学习难以确定的设定造成逻辑结构的不确定性。这个原因要素包括法理基础不够完善、〔7 〕实证研究成果未予应用“跑测数据”、价值判断和社会效应很难纳入推理等。比如，在案件智能类推方面，因数据采集的体量大、对象层次复杂，所以传统的数据采集只是将众多已公开的裁判文书按类别放到统一的“数据池”，然后根据搜索引擎的关键词逐步切换到下一个模块，最终查找所需内容。具体如体系检索法、关键词检索、案例倒查检索，这些背后的原理基本相同，基本做到了数据的有效整合和智能搜索，但缺陷是因未能建构类似于人脑的审判思维的数据提取和智能推理，所以导致智能类推的内容存在全而杂的问题。智能推理模块的编写需前期对非结构化内容进行人工的大样本分析和知识图谱设计，然后根据不同的功能进行以程序语言和人类表述语言相互结合的信息逻辑设计。如果这个问题不进行艰难尝试，并且进行长期有效探索，真正的AI下的专家系统很难有效建构。

3.系统场景设计高度同质化。民事案件案由共424个，因覆盖面广、类型复合高、类案差异性大等特点，所以单一的场景设计路径难以满足多元化、复杂性的案件类型要求。目前，大部分智能办案系统的研发路径依靠模仿类似“审判要件九步法”“法律适用五步法”等抽象思维模式或者办案流程程序来设计场景要素的方向是对的，但是这样设计的弊端在于专家知识模型越通用，就越会包容噪音，带来高拟合性和重复性，更带来智能辅助的不精确性。〔8 〕反之，专家知识模型的设计路径越体现案件的个性化特征，就越无法夹杂无用的信息；适用的场景越有限，提供有条件检索或者智能辅助就更精确化。目前办案系统并不具备知识获取能力和对复杂场景的自适应能力，只有在通用场景下强化在特定场景下的设计和学习，才能避免系统场景设计的高度同质化，最大化地接近案件自身的真实，并且对于真理的可证伪性保持谦抑。二、理论支撑：AI系统的建构路径

为解决办案系统数据采集非标准化、案件模型建构同质化的问题，应积极建构符合法理依据和满足技术要求的应用性强的民商事案件智能辅助办案系统。笔者在分析、研讨上述问题的基础上，认为在研发技术载体上应坚持专家系统和人工神经网络技术并存发展的路径，这对民商事案件智能辅助办案系统的初期建构非常必要。在初期的研发路径上分三步：第一步是仿照裁判方法成果进行树状结构图梳理，再通过排除选项和人工提取法律文本中的审判要件进行建构；第二步是立足审判要件、庭审笔录和裁判文书（非结构化文本）等，对案件进行要件提取与数据标注，进而归纳各种可能出现的情形进行模块化建构。第三步是将裁判思维提取与审判要件标注通过技术领域的算法进行研发整合，并在数据跑测下完善对大量案例和文档的深度学习和分析。

（一）民商事专家系统的破题基础

1.研发对象的选择原则。AI下的民商事智能辅助办案系统的研发按照对象类别可分为简易型和复杂型，初期研究对象的选取上应考虑简易类型为主，复杂案件为辅，但是最好两类案件可以在体系上一脉相承。研究对象的选取一定要科学论证，通过大量的试错与有益尝试，初期研究对象的选取最好满足以下原则。第一，选择的领域应是一个相对自我完备的法学分支领域，比如法律架构完整的合同法，但是合同法项下子项目过多，需要进行限缩。第二，该法律领域的确需要法律专业知识，比如合同损害赔偿中涉及与有过失、损益相抵等专业词汇。第三，最好选择一个窄而深的领域，而不是广而浅的领域，这样的角度方便日后从简易型扩充到复杂型。第四，最好选择法律专家争论较少的领域，避免逻辑不清或者适法不统一的情形。第五，选择的领域不需要大量知识性常识。〔9 〕比如，S市高级法院开发的知识产权民事侵权案件赔偿数额专题分析系统、该市某中级人民法院研发的金融诈骗类犯罪分析系统和该市F法院开发的道交案件大数据分析系统均在研发的选取对象上遵循上述原则，并在辅助审判环节中取得较好效果。

2.研发建模的法理基础。民商事案件智能辅助办案系统的模型建构需要提出关于法律推理性质的假设，该假设不仅需要基础性的法律知识，更需要法律推理的完整理论，即法学规范理论、法学推理理论、描述法律科学的理论。〔10 〕尽管法律推理十分复杂，但它具有相对稳定对象（案件）、相对明确的前提（法律规则、法律事实）及严格的程序规则，且须得出确定的判决结论，这为人工智能模拟提供了极为有利的条件。〔11 〕历经法学理论的变迁演化和人工智能技术的迭代进步，基础性的法学理论依旧是人工智能建立数学模型并编制计算机应用程序的基础。如法律形式主义、法律现实主义、开放结构等理论为办案系统建模提供了强大的法学理论基础。

法律形式主义〔12 〕遵循三段论的推理逻辑模式，最基本的两个要素为机械的演绎推理和封闭的规则体系，其认为将法律化成简单的几何公式是完全可能的。〔13 〕同时以图尔敏和佩雷尔曼为代表的逻辑学家们开始把注意力转向实践推理特别是法律推理领域，开辟了法律逻辑研究的新领域。〔14 〕该法律逻辑理论的进一步发展为人工智能的司法应用提供了可能的理论前提，20世纪70年代开发了律师推理系统，使机器法律推理第一次从理论变为现实。〔15 〕但法官所从事的法律活动不可能不受到其社会体验和思维结构的影响，尤其是民商事案件夹杂了大量社会利益的衡量问题。因此，法律形式主义忽视了推理主体的社会性，造成系统设计僵化性的致命弱点。

此时法律现实主义〔16 〕的理论运用促使人工智能研究从模拟法律推理的外在逻辑形式，进一步转向通过探求法官的内在思维结构，总结裁判经验中的规律性和普适性问题。在此背景下，大规模知识库系统（KBS）〔17 〕开发就注意了思维结构的整合作用，又通过联想程序被有机联系起来，构成具有法律推理整体功能的系统。〔18 〕

“开放结构”理论〔19 〕为人工智能在司法领域的深度学习应用提供了理论基础，打开了疑难案件自下而上的法律推理模拟的思路。〔20 〕在这一理论的指导下，人工智能在司法领域可以进行更具深度和广度的应用，一方面是将简易问题从疑难问题中筛选出来，运用基于规则的技术来解决；另一方面是将疑难问题先用非案例知识，如规则、控辩双方的陈述、社会常识来获得初步答案，再运用案例来比对，检查案件的正确性。上海市高级人民法院目前承担研发“推进以审判为中心的诉讼制度改革软件”的任务正是对这一理论最好的实践和诠释。〔21 〕

3.研发路径的技术支持。早期的法律智能辅助系统研发路径主要依靠专家系统理论〔22 〕来构建，如国外具有代表性的美国D.沃特曼和M.皮特森1981年研发的法律判决辅助系统、1993年武汉大学开发《实用刑法专家系统》等均是通过大量“如果-就”（If-Then）规则定义进行“自上而下”的设计。专家系统理论是在产生式系统的基础上发展起来的，通过知识库和推理机两部分来描述从一个基本概念演绎出的系统。〔23 〕虽然专家系统存在欠缺自我学习的能力等缺点，但现阶段关于利用人工智能进行法律推理、建立司法裁量模式，专家系统仍是人工智能与法律结合研究的重点之一。〔24 〕

目前，人工神经网络是AI研究的另一个重要方向，属于“自下而上”的机器学习思路。它的基本特点是试图模仿大脑的神经元之间传递、处理信息的模式来解构法律问题。其技术研发的路径和步骤：通过小样本数据进行对偶研究，然后经过监督学习、人工打标签、强化学习、交叉验证、原型开发、模型测试、业务试用、模型调整等阶段完成初期研发任务。

根据上述两个技术研发路径和理论支持，民商事案件智能辅助办案系统的架构建设在技术开发角度看具有较高的同质性，基本均采用依靠专家经验提取案件要素和证据规则，通过大量的人工化的要素标签建立起办案系统的标签体系，再通过逻辑建模、物理建模等对数据进行机器学习训练，同时形成数据支撑下的神经网络再造和发育，通过数据的优化、迭代最终实现机器对法律各领域的自主学习功能，实现民商事办案系统的智能化。综上所述，根据需求正确地引入不同的研发技术路径可以有效地将审判要件进行系统归类和裁判思维的构建进行有机契合，使其达到研发目标。

4.研发步骤的注意事项。细节决定成败，蹄疾步稳中坚持法律问题标准化、技术问题简单化的原则。法律问题标准化建设包括术语表达统一内涵、裁判依据的归纳概括具有明确性等，为解决好此方面的问题，需要经验丰富的法官在实践的过程中有计划地逐渐统一术语表述，并通过完善类案制度统一裁判依据。涉及技术问题简单化方面，主要针对法律工作者与技术人员的知识嫁接“鸿沟”问题，该内容的清障是各环节工作开展的基础，通过总结优化各机构的研发经验，涉及审判逻辑方面的内容可以通过思维导图方式进行图示化展示，可尽可能的将双方沟通的内容精准化。涉及技术语言的理解方面，首先，要确定文本语义相似度比较的对象，并实现语义相似度计算。讨论的对象包括篇幅划分（如词组，段落还是全文）和结构划分（如证据、法院认定和法律依据）两个方面。其次，采用何种自然语言描述推理规则的提取关系到规则库、领域库和法律库（例如储蓄存款合同纠纷案由相关的法律）的设计和构建技术。最后，输入系统的语义概念和逻辑体系必须自洽，不能含糊不清甚至互相矛盾。

（二）民商事案件智能辅助办案系统建构的方法初探

民商事案件办案系统的智能化是个宏观而复杂的问题。主要以裁判思维的成果整理和类案要件提取标准化建设作为逻辑起点的两个方面进行办案系统建构初探。

1.裁判思维的整理与提取——数据结构树的逻辑起点。按照诉讼请求、法律关系、法律规范、案件事实、法律结论的逻辑思路建构裁判思维。在这套系统工程中，我们要善于归纳、利用已有的裁判思维的研究成果，运用到数据的清洗、整理过程中。典型的民商事案件讲究以请求权为基础作为审判逻辑的起点，在经过充分学理研究且有强大实践大数据作为支撑的情况下，已有的较成熟的裁判思维方法的模型研究可否有效运用到审判数据建构基础值得尝试，为办案系统中的模型建构建设奠定扎实基础。

（1）诉讼请求表达固定化。诉请基础的固定事关整个诉讼，所以要在系统建构中先决的预设完整、精准的请求权词语表达。在这方面，S市某中级人民法院已卓有成效的构建了诉讼请求主题词库和裁判文書主题词库，在诉讼请求主题词库方面进行全面的、标准化的整理编撰，细分300项案由，1483项诉讼请求。〔25 〕这项诉请的整理基于最高人民法院关于案由的规定，但又创新的结合司法实践中常用术语表达进行升华。同时对提出各项诉请所依据的请求权基础及法条的原文进行整理和编纂。这一步的跨出实质地解决了诉讼中请求权基础词语混杂、机器学习难以识别的问题，增强了案件信息间的聚合度，有效回应了案件信息的非结构化难题，为办案系统的建构提供了标准化、体系化的审判数据模型。

（2）推理模型选择与场景深化设计：诉请固定后如何选用适合的裁判方法或者要件方法系办案系统设计中的核心问题。目前而言，实证表明所谓的逻辑三段论在实践中套用情形并不足以支撑细化的案件事实，所以三段论只能作为检验模型设计是否合理的工具或者语言编写的程序，但不适宜作为案件推理模型进行整体设计。如果能够将所有的法律论证置于演绎论证框架之内，就可以将所有的法律推理和论证交给计算机处理。但是司法实践中的法律概念、规则往往可以作不同解释，而且往往是诉诸例外的，如果遵循演绎主义，每增加一次例外就重写一次公式，无疑会增加一阶公式表达的复杂性，因此需要另寻途径和方法。法律实践表明，将法律推理处理为一种非单调推理〔26 〕是有效的解决办法。〔27 〕目前，从实践中看案例法律推理和规则法律推理现在已聚合了，这个框架提供了一个能够组合规则推理和案例推理的语境。人脑的逻辑基础是非形式逻辑，而电脑的逻辑基础是形式逻辑。如果说形式逻辑对论证的分析与评价仅仅是建立在语义和句法维度之上的话，那么非形式逻辑显然在形式逻辑框架基础上引入了一个语用维度。

在场景模型的选择上，经过反复研讨并与技术人员沟通，笔者认为有两种进路选择可供参考。一种是以引入德国成熟的裁判模型，即法律适用方法中常用的归入法或者相关性分析法。优势在于裁判思维模式成熟，简单案件适用归入法，复杂案件适用相关性分析法，同时技术层面的树状图制作也不复杂。劣势在于模型较简单和我国实践中较少应用此方法，需要一线法官逐渐在案件中丰富并进行深化设计，但受限于目前我国法官队伍掌握此裁判方法的人并不多，制约了该方法的快速系统地应用。另一种是尝试直接试用我国理论学界或者法院实证已受关注的民商事裁判思维。其优势在于裁判规则逆向总结贴合司法实践，同时丰富的类案模型设计可以满足基本的案件需要并方便机器深度学习，尤其现阶段的研发进展使研发者越来越清晰地认识到不同类型的法律问题要求不同的推理形式，如证据推理不同于法律解释，而法律解释又不同于法律规则适用或立法辩论。〔28 〕在这样的法学理论和技术要求的背景下，通常场景模式下的特定化场景构建就是一个非常重要的内容。比如，四川省郝廷婷法官实证研究归纳七种典型的民商事裁判思维方法就非常符合特定的场景化构建要求，分别是回流型、往返型、衡平型、循环型、同步型、逆向型、顺向型。〔29 〕这七种类型是在请求权为基础的裁判思维方法下，通过司法实践的指引细化特定场景下不同案件的审理步骤等。这也只是实证分析中认可的一种思维方式，此类问题值得深入研究和扩展应用。

以上两种进路无论选择哪种作为模型基础都是初步的框架性逻辑设定，需要在数据跑测中逐渐丰富和完善，更离不开我们审判实务部门在日常的审判活动中积极整理各种疑难案例的裁判思路。

（3）思维导图的充分运用：思维导图是一种将放射性思考具体化的表达方法，优势在于清晰展现案件全部裁判思维流程，具有点线面结合的特点，易于将复杂的问题简单化，在数据建模的始端概念建模阶段通过思维导图易于明确产品需求以及业务规则，避免法律人口述或者文字表达后技术人员理解偏差的问题。然后落实到实体，〔30 〕这些信息将来会成为数据字典中非常重要的一部分，也就是所谓的元数据。比如，结合司法实践的研发实例，借记卡盗刷类案件通过尽可能的贴合程序员的设计路径，来运用法律思维导图进行各研发要素的表达，达到了较好的效果，这种单向性的逻辑表达设计具有简明性特点。在工具选择上以PROCESS ON或者XMIND等导图工具进行操作，建议裁判者可以学习这方面的知识，既方便审判思维的归纳整理又利于日常工作思维记录。在制作的过程中需要注意的是，尽可能使用单一化的线条表示，避免导图发散过多。如果说案件非常复杂，包含往返穿梭式的涵摄，具有极其复杂性和抽象性的话，建议使用正面或负面清单的表述进行来备注。

2.要件标准化和标注化建设——数据标准化的建构过程。类案要件提取标准化、标注科学化、问答交互化处理可以帮助我们构建各类型案件的审判要素模型，形成从生产到加工再到产出的这样一个司法大数据产业，为构建裁判数据模型暨办案系统的知识库建设奠定基础。

（1）要件提取“标准”化。国外在进行应用之前，通常将已有的类案研究成果进行标准化提取，然后再根据各类案常用的不同审判思维进行模拟编程，这种将理论研究成果与法律科技创新相结合的方式已得到绝大部分实务人士和技术人员的认可。但是问题就在于一般的标准化提取要件如何实现结构化和科学性。从宏观上看，法官的智慧是最核心的财富，审判业务部门应配合好要件提取工作，通过类案审判要件的大数据分析总结案件具体特征、事实情况、诉请与抗辩内容等填充到树状结构图，通过样本的机器学习最终有效得出所需结果。笔者正在尝试利用审判要件标准化的提取来构建AI知识图谱。如当事人的诉讼请求为“查阅、复制会计账簿”可以快速定位其请求权基础及其构成要件，并且通过对应被告的主要抗辩理由，可以快速对案件法律关系予以整体性的把握。

从微观实证上看，每类案件具有其特殊性，需要分类整理证据内容与证明目的、通常争议点及对应的法律依据。比如，德国Hollatz教授采用高斯发散神经网络的方法对200个非物质损害案例进行类案提炼，利用数学模糊性的评价系统将数据推理具体化为：伤害类型、持续时间长短、造成的后果的严重性、性别、职业的损害、特别严重情节和医疗损害，最终获取非物质损害的裁量模式，〔31 〕该模型良好地运用于非物质损害的赔偿系统软件中。目前，S市民事、行政案件智能辅助办案系统通过人工提取大量卷宗和整理各类材料，已建立包括证据规则、证据指引库、办案要件（六类八个案由）、立案审查关键要素库、诉请库、抗辩库，案例库等12项大数据库，为办案提供信息支撑和保障。

（2）类案“标注”科学化。标注系技术用语，应用于模型和复杂神经网络建构，如标注的数据越准确、数量越多，模型的效果越好。所以类案标准化确定后标注内容表达要素提取要全面化、科学化，S市某中级人民法院在两库建设中的做法值得我们关注。运用技术手段对裁判文书主题库方面中各类案由所含的高频词汇，关涉事实认定和法律适用难点的关键词，以及文书中所含的包括但不限于行业经济发展、社会综合治理人员结构等重要要素高亮提示，以“贴标签”的形式予以设置标注，共梳理2654个主题词。〔32 〕比如，在民事领域该法院选取近3年案件量较大的机动车交通事故纠纷中3000份文书进行高频词汇分析并标注，得出案件特点、诉请内容、证据类型、胜负趋势等。在刑事领域，案情预测系统“法狗狗”设计思路正是：对于人类说不清楚的问题，通过裁判文书整理后输入大量的标注数据，通过机器学习等算法得到测量值最终得到同案类判的匹配结果。这种主动标注的方法，整体上看类似于百度后台有强大的数据标注员一样，为后续机器智能深度学习打下基础。目前，S市民事、行政案件智能辅助办案系统已建成8组标签体系支撑办案系统的前期运行，为后续的迭代开发奠定坚实的基础。

（3）类案“问答式”交互化。深度学习技术将改革人们与技术的交互方式，同样智能辅助办案系统如何在设计应用中体现这种交互性非常重要，也事關能否实现法律AI化的关键。笔者也正在尝试利用在类案“庭审笔录”整理与“思维导图”的指引下，通过EXCEL表格细化法官审理思维，实现当事人求问思维和技术人员程序思维的问答交互，进而在程序编写过程中可初步跑测数据的合理性。现在外界的研发机构的基础数据主要为对外公布的司法文书，不包括庭审笔录、专家研讨会议笔录或者其他不可对外的秘密内容。但是笔者认为这些内容对于办案系统建设至关重要。比如，庭审笔录系法官根据案件事实情况逐一将要点查明的思维方法的书面化表述，也是对于同一类型问题的庭审确认和争议问题的庭审辩白。

三、实务指南：AI示范模本的应用

在上述问题意识的指引下，下面以银行借记卡被盗刷的储蓄存款合同纠纷为例。进行标准化的审判要件提取和裁判结构树的建构，做到智能深度学习与服务诉讼当事人的作用。以下内容系S市M法院与H省某大学机构按照数据的来源侧、数据的处理侧、数据的产业侧暨挖掘、分析、应用等三个方面进行共同研发的微观展示。

（一）研究对象的选取与破题技术的基础

1.研究对象的符合性。借记卡盗刷类案件在研究对象上具有限缩性特征，避免出现研究面过大的易遗漏问题。研究的立足点基于违约或者侵权损害赔偿的要件体系具有完整性，符合智能推理的逻辑自洽性。更重要的是该类问题的诉请、证据形式、争议焦点都比较明确和统一，有利于率先尝试简单案件智能化。同时该类案件符合热点问题的回应性和智能研究领域的空白性特点。

2.技術性目标的设定。第一步，以“伪卡盗刷”类型为案由的判决书收集和分析（法律研习者为主）；第二步，研究基于结构和语义的判决书文本提取和语义匹配方法（高频词汇整理外以技术人员为主）；第三步，研究基于规则的判决结果诊断方法，设计和实现基于规则的判决结果推理服务；第四步，研究基于模板的判决书生成方法，设计和实现基于模板的判决书生成向导服务。上述第三、四步主要以技术人员为主导。

（二）裁判思维的整理与提取

1.诉讼请求表达的确定系源泉的固定。设定程序后电脑自动下载1600份伪卡盗刷案件的判决后对诉请部分进行结构化文本的提取、理解和分析。整理诉请表达如下，案由为储蓄存款合同纠纷，请求权表达通常为原告向某银行主张的赔偿盗刷具体金额。附加内容为原告主张的赔偿利息等损失的金额、计算方式及起止日期。极个别情况下有些原告的诉讼请求中包含解除合同、要求赔礼道歉等内容。

2.模型选择与思维导图深化表达。根据上述第二部分的七大常用裁判思维模型分析来看，储蓄存款合同纠纷常用的裁判思维属于逆向性逻辑，逆向性的民商事审判思维通常适用于信用卡纠纷、储蓄存款合同纠纷、金融借款纠纷案件。在模型设计上即对已有书面材料或者问题的审查完成后，很大程度上对结论的形成起了决定性作用。庭审查明或者问题互答只是为了排除例外事实以及法律规范的寻觅，主要作用则在对于预设结论的进一步验证。〔33 〕按照以上的“逆向式民事思维”检索顺序制作逻辑树和思维导图。步骤演示，第一步：诉请与证据类型；第二步：得出预设结论；第三步：排除例外事实；第四步：寻找法律规范；第五步：作出裁判。最终通过制作思维导图，暨与技术人员沟通较为流畅的导图化表达。

（三）要件标准化提取和标注科学化建设

按照要件标准化提取伪卡盗刷类案件，首先审查原告请求权基础并将其固定化，如审查原告向发卡行或特约商户的主张、原告诉请是否明确等；其次审查被告的抗辩权基础，如被告对民刑竞合情形下该案件受理是否提出异议、对诉讼时效是否异议、伪卡交易过错责任抗辩等；同时进一步归纳争议焦点，如一般而言，伪卡交易中发卡行有无尽到注意义务，在伪卡交易中有无过错对损失的产生有因果关系等；再次根据规则分配举证责任，最后明确归责原则，具体不再一一赘述。

同时要件标准化下关键词提取系重要任务，即高频词汇整理。第一步，选取200份借记卡盗刷案件的裁判文书，即“伪卡盗刷”类型案件的判决书大范围采样，采样过程中需注意判决书采样的审理地区、审理审级等问题，建议采用法律发达地区或者该类型分布较密集地区为主。第二步，对高频有用词汇进行标注细化，涉及的技术问题如分词、词典建立、词性标注和相似度计算（文本匹配）内容等由技术人员根据大数据自动高频检索进行分析。在此过程中除却传统类案研究的书面报告整理外，笔者整理出一套行之有效的新方法。在第一步的基础上，先挑选200份相关案由的判决，全部下载下来。然后阅读3-5份判决，寻找20个左右大概出现的特殊词，接下来将所有文档进行合并，创建一个文档，word中有插入文档选项进行批量（多选）插入文档。最后在合并后的文档对20个词进行分别查找，统计每个词出现的频率（一般100次），并按照频率进行排序。

（四）人机对话的互动基础设计

立足当事人咨询、法官询问和银行抗辩三者的角度构建智能辅助化的咨询系统或者类案结果智推系统。选取大样本的庭审笔录是先行之举，通过对庭审笔录的充分整理和高度概括明晰审理此类案件的事由和问题。比如，笔者通过庭审笔录为基础，结合判决书等材料标准提取和裁判树状设计问题取得良好效果。只有以持续不断的数据记录，数据分析模型形成支持事实还原的证据；以用户为中心的司法流程设计依靠高度结构化的改造，才能大大降低当事人进入司法通道的成本，方便法律服务的获取和起到智能交互作用

随便看

科学优质学术资源、百科知识分享平台，免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。