著作权视域下 委托开发AI应用软件的风险把控研究

    唐泽 李旭

    

    

    摘 要:以色列历史学家尤瓦尔·赫拉利在《今日简史》中将科技颠覆视为21世纪人类面临的巨大挑战之一,并认为以算法为共识的人工智能将会对人类生存状态和生活方式带来革命性的改变。目前“新冠肺炎的病原学检测”“人脸检测和识别”“语言识别”等人工智能已走入社会生活的方方面面,面对方兴未艾的人工智能,如何把控其开发风险?文章避开深奥的人工智能技术,从具体案例入手,从法律维度着重探索了著作权视域下委托开发AI应用软件的风险把控。

    关键词:著作权 临床辅助综合诊断AI 应用软件 风险把控

    人工智能(Artificial Intelligence)英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。[1]通俗来讲,AI就是通过采取自我学习等一系列重要方法,使机器模拟人类智能。2020年初,AI在抗击新冠肺炎临床救治一线为国家公共安全作出了非凡贡献:阿里巴巴达摩院与浙江省疾控中心合作,将AI算法应用于新冠肺炎的病原学检测上,利用算法将疑似病例基因分析时间缩至半小时,同时可以避免核酸检测出现的漏检情况。2016年,运用AI算法开发的围棋机器人AlphaGo击败人类围棋顶尖高手,缘于它结合了数百万人类围棋高手对弈的棋谱,通过强化学习进行了自我训练。获胜之后,AlphaGo之父杰米斯·哈萨比斯表示:“AlphaGo能利用机器学习技术,通过自我教学去掌握围棋。最终,我们希望将这种技术应用至现实世界最重要的问题,例如气候建模,以及对复杂疾病的分析。”[2]近些年,AI在医学影像设备的图像重建、勾画靶区、判断病理切片等临床应用上取得了人工无以能及的高速运算能力和准确判断能力。值得注意的是,当前,出版领域的著作权委托开发AI应用如日方升,具体实践中我们发现,稍有不慎极易引发法律纠纷。笔者近期接触了一些委托开发AI软件产生的版权归属、软件安全性问题等争议调解,感受颇深,引发了我们对同类问题的思考和探究。在此以《临床思维基础与方法》委托开发临床辅助综合诊断AI应用软件为例,粗浅探讨著作权视域下委托开发临床辅助综合诊断AI背景条件及其风险把控等问题。

    一、著作权视域下委托开发临床辅助综合诊断AI的前提

    21世纪,人类处于一个史无前例的巨变中,以信息化和人工智能为标志的生产智能化程度突飞猛进,医疗AI也随之取得了长足发展。医疗科研工作者将潜心研究的临床理论专著深度开发为AI应用,审慎地应用于临床,有力推动了临床诊治水平提升。但必须注意,科研论著委托开发为临床辅助综合诊断AI应用软件,实现“值得信赖的AI要求算法足够安全、可靠和稳健,以处理人工智能系统所有生命周期阶段的错误或不一致”。首先要满足以下五个必要条件。

    1.建构科学精确算法

    AI算法针对具有相同属性的一类事物,遵循一定的数学模型,处理信息做出决定的方法。本文涉及的临床综合诊断算法,则是针对临床定性信息(病理改变数据)和定量信息(检验结果数据),依据相应的算法进行复杂的运算后得出客观全面的处理方式。如下图1是以医学专著《临床思维基础与方法》为依据,对临床思维内容和逻辑的解析而得出的原创性临床思维理论及其算法。科学家李四光指出:“科学尊重事实,不能胡乱编造理由来附会一部学说。”临床综合诊断算法必须建立在临床客观事实基础之上,第一具有“可靠性”即基于医学知识和临床数据提炼得出,可对临床医学问题进行科学分析判断和解决;第二“正确性”即对临床数据的处理邏辑符合医学知识的内在逻辑,与可靠性协调统一;第三“可解释性”即处理临床数据进行推理的每一步可用医学知识解释——以避免“算法黑箱”(即推理的不可解释性);第四“可操作性”即可实现临床数据、信息的结构化,使其可以满足人工智能大规模运算对数据的要求等四大特性,才能为开发“值得信赖的AI”提供科学研究支撑,才能经得住临床检验。

    2.归集客观完整病案

    临床辅助综合诊断AI的开发是基于大量的客观完整病案。客观完整病案应该是指如实记录患者主诉、病史、体检和各项检查结果,包含诊断、治疗方案及疗效的病例资料。所以,归集整理病案是开发工作的基础和前提。随着信息技术迅猛发展,如今医院病案室已经对所有病案实现全流程、全要素、全单元的系统化、规范化和可视化收集、整理和保管(门诊、住院),这些海量临床医疗数据,可以为教学、科研、临床经验总结等提供可靠、快捷的支撑和保障。故而在开发AI之初,务必要注意进行筛选把关,从源头上精选典型病案、防止问题病案混入其中,确保所开发临床辅助综合诊断AI的基于真实可靠的数据。

    3.取得完整著作权使用许可

    著作权的使用许可是著作权人许可他人在一定期限、一定范围、一定条件下,对自己享有著作权的某一或某些特定作品,使用其著作权中财产权部分的一项或几项权利。除《著作权法》规定的合理使用、法定许可等可以无需著作权人授权许可的情形外,使用他人作品应当同著作权人订立许可使用合同。唯拥有著作权使用权,方可依法享有包括民事、行政、诉讼等方面的权利。因此,著作权委托开发AI,必须取得著作权人正式授权,倘若取得的著作权许可使用授权是由各合作作者共同享有的合作作品,且不可以分割使用,必须依《著作权法实施条例》第九条规定,通过协商一致取得行使权利。

    4.优组专业设计团队

    开发临床辅助综合诊断AI应用软件,必须是既能深刻理解《临床思维基础与方法》的函数临床思维f(x)=y理论,同时又能掌握其AI算法,并就此算法进行建模设计的软件工程师。就像AlphaGo之父杰米斯·哈萨比斯不仅是国际象棋高手,又是计算机软件设计师。想要寻找具备医学和计算机交叉学科背景的复合型优秀人才,可以说是凤毛麟角,实际开发中,我们可以把高水平医学专家和AI专家强强结合,组建优势互补的开发团队,集智攻关,充分发挥1+1>2的效能。团队组建后,针对专著内容模型构建的具体算法进行反复磨合、反复交流、反复沟通,在全面吃透、融会贯通基础上,经团队专家评估后确定开发的原则、路径和方法,如此可保证总体方向正确,有效提升AI软件开发工作效率。

    5.严格遵循行业准则

    “行身践规矩”。唯有遵循行业准则,所开发的临床辅助综合诊断AI才会取得业内人士共识,才可探索生命规律,达到科技造福于人类的目的。目前,我国行业准则有国家新一代人工智能治理专业委员会发布的《新一代人工智能治理原则——发展负责任的人工智能》包括八个原则:其中第一条“和谐友好”。人工智能发展应以增进人类共同福祉为目标;应符合人类的价值观和伦理道德,促进人机和谐,服务人类文明进步;应以保障社会安全、尊重人类权益为前提,避免误用,禁止滥用、恶用。第二条“公平公正”。人工智能发展应促进公平公正,保障利益相关者的权益,促进机会均等。通过持续提高技术水平、改善管理方式,在数据获取、算法设计、技术开发、产品研发和应用过程中消除偏见和歧视。第三条“包容共享”。人工智能应促进绿色发展,符合环境友好、资源节约的要求;应促进协调发展,推动各行各业转型升级,缩小区域差距;应促进包容发展,加强人工智能教育及科普,提升弱势群体适应性,努力消除数字鸿沟;应促进共享发展,避免数据与平台垄断,鼓励开放有序竞争……这八大原则均围绕促进新一代人工智能的健康发展,更好地协调发展与治理关系,确保人工智能安全可靠可控,推动经济、社会及生态可持续发展,共建人类命运共同体等方面提出了要求。这八项原则是AI开发和应用必须遵循的原则和路线。

    但我们在接触著作权委托开发AI争议中深切感受到,著作权委托开发AI应用软件,极易出现AI技术性问题(包括可控性、稳健性和安全性等)、商业机密泄漏、著作权归属争议三类核心风险,从源头上对这些风险因素严格把控,是成功开发“值得信赖的AI”关键所在。

    二、AI应用软件运算可靠性及其控制措施

    臨床辅助综合诊断AI作为一种计算机软件,其开发目的是让计算机通过深度神经网络模拟医生的头脑进行学习、判断和决策,以期达到模拟医生解读、分析病例和判断病情的能力。从图2可以看出,AI三大要素:算法、硬件、数据缺一不可,[3]而算法是影响AI最终运算分析结果的首要核心要素。若最初AI软件设计师不能深入理解临床诊治路径和科学把握临床综合诊断算法,那么在模型设计阶段哪怕一个细小的纰漏,当相关数据输入计算机后,依据其研发的AI算法最终运算结果或将谬之千里,这无疑影响AI可控性、稳健性和安全性。

    毋庸置疑,从源头上控制AI可控性、稳健性和安全性是解决问题的关键所在,即需在AI软件设计之初,委托方以合同的形式约定受托方,对所开发AI应用软件必须从构架设计开始到移交为止的全程技术把控。质量控制流程可效仿图书质量管理“三审三校”制度,设立各系统和过程控制的“责任编辑”制度。例如,《临床思维基础与方法》专著委托开发临床辅助综合诊断AI软件,首先,在AI软件开发前,在明确权利人时,确定医学系统和软件系统总负责人,分别对临床辅助综合诊断AI的算法及其程序设计负责。每个子系统也相应设立责任人,分别对口向上一个级别负责汇报,这样可以把所有系统和开发过程纳入闭环管理之中。其次,约定AI软件提交用户验收前,要求开发流程中诸如软件系统和概要设计、软件编码、软件测试等每个环节,都必须由责任设计、责任编码、责任软件测试三类技术人员进行严格的“三级审核”和“三级测试”质量控制。再次,若遇AI软件修改进行的回归测试,还务必于每次回归测试的同时,连同程序设计说明书、流程图、用户手册等在内的文档也要再次走一遍“三级审核”和“三级测试”质量控制流程。

    三、AI算法和数据防泄密办法构建

    目前那些用户体验好并已形成好口碑的AI应用软件,极易在激烈的市场角逐中成为不法者窃取商业秘密的目标。侵犯商业秘密的手段繁多,或通过软件开发企业员工、前员工侵犯商业秘密,或“黑客”以非法手段侵入他人计算机系统、植入电脑病毒等旁门左道盗取商业秘密。

    商业秘密泄密,除了由《反不正当竞争法》第九条列举的四种侵犯商业秘密行为以及“黑客”非法入侵等情形导致外,还与商业秘密权利人采用的保密措施有关。为此,权利人可依法构筑一套综合防范体系,以营造一种相对去危就安的环境。权利人具有在法律范围内实施某种行为的积极行为的权利,也有请求义务人履行法律义务的请求权,在义务人违反法律要求其承担的义务时,还具有诉诸国家法律,要求协助保护其权利的要求保护权。例如,《临床思维基础与方法》专著委托开发临床辅助综合诊断AI软件开发伊始,权利人就敏锐地意识到在软件开发中保密的重要意义,为防止AI应用软件最核心的商业秘密——算法和临床医学数据(见图2)泄密,权利人即用严谨的合同条款对义务人进行了三个方面约定:一是在保密层面,针对《反不正当竞争法》第九条列举的四种侵犯商业秘密行为,在保密条款中对应四种侵犯商业秘密行为进行了规制,以限制义务人恶意泄密;二是在软件开发技术层面,约定义务人必须运用数字化信息技术,设计针对临床辅助综合诊断AI软件的数字著作权进行保护的整套技术方案,以使AI软件不被非法复制、修改和任意传播;三是在制度管理层面,以制度的形式约定义务人遵守规定的权限,约束义务人若未履行一定的手续,不得擅自越权运行AI软件。

    上述对义务人制约的方式并非万无一失。因为,随着互联网的发展,软件加密技术在不断升级的同时,一些“电子侵入”防不胜防,通过对软件复制、重编等技术改头换面后进行盗版软件生产。《反不正当竞争法》明确将“电子侵入”列为不正当获取商业秘密的手段。对此,权利人可以通过逆向工程(又称逆向技术)溯源方式来寻找证据。查看疑似盗版的AI应用软件是否是通过设计技术再现过程进行逆向分析及研究,从而演绎并得出正版AI应用软件的组织结构、功能特性和技术规格等设计要素,并制作出功能相近,但又不完全一样的产品。若逆向工程破解结果发现其核心要素是盗用权利人算法(完全一样)和临床医学数据(部分吻合),则可以按合同约定要求相关义务人协助进一步确认证据并起诉。

    四、AI应用软件著作权归属争议及其解决途径

    AI应用软件著作权归属争议,往往体现于开发成果的著作权分配的约定,这是著作权委托开发AI合同的重点,倘若双方对合同表述条款理解不一,极易滋生争议或纠纷。例如,《临床思维基础与方法》的原创性函数临床思维理论及其算法,委托开发临床辅助综合诊断AI软件案例中,委托人约定“向受托人支付开发费用,全部版权归委托人所有”。但受托人要求合同的著作权归属条款更改为“所委托开发的AI软件,其著作权以及进一步开发的权利归甲乙双方共同所有”。委托人则认为:“AI应用软件的核心要素是我方的臨床综合诊断算法,在合同中已约定了我方向受托方支付报酬,即视为买下了所开发AI应用软件的著作权”。《计算机软件保护条例》第十一条规定“接受他人委托开发的软件,其著作权的归属由委托人与受托人签订书面合同约定;无书面合同或者合同未作明确约定的,其著作权由受托人享有。”可见,法律规定委托作品的著作权主要是通过委托合同来约定。本案中委托方约定的支付报酬,只是对受托方开发AI应用软件付出创造性劳动的补偿,但不能认为这就是买断AI应用软件的著作权。

    本案焦点问题集中体现为委托方欲力图取得AI软件著作权而对合同条款不认可所引发的争议。合同属“契约”类文书,是就其中涉及问题经过谈判或共同协商谋求意见一致后,所订立的一种具有经济或其它关系的契约性文书。为了保护合同当事人的合法权益,维护社会经济秩序,争议完全可通过再谈判或协商来达成共识,例如,可参照经济规律和医疗AI科技前景预测为前提,修改付酬条款,或约定受托方作为技术资源投资,与委托方共同发展等方式,以达到如期履行“契约”的目的。

    值得指出的是,虽然《计算机软件保护条例》第五条规定“中国公民、法人或者其他组织对其所开发的软件,不论是否发表,依照本条例享有著作权”,即“自动保护”原则,但软件需经过登记后,软件著作权人才享有发表权、开发者身份权、使用权、使用许可权和获得报酬权[4]。

    五、总结

    信息技术飞速发展,不断催生出新的著作权类型,例如,互联网书刊、著作权委托制作的音视频产品、著作权委托开发的AI应用软件等。我国一贯重视著作权的保护,旨在用法律手段、经济杠杆来激发和保证智力产品的创新和传播,促进社会主义市场经济繁荣,推动人类文明发展进程。为了适应社会的发展和科技的进步,我国陆续对正式颁布的《中华人民共和国著作权法》《计算机软件保护条例》《信息网络传播权保护条例》等相关法律法规进行了适时的修订。信息科学与技术驱动下的数字经济风暴势不可遏。数字化时代,数据已成为21世纪最重要的资产,随之带来的算法泄密、数据被盗不可避免,这无疑要求我们一方面要紧随科技发展的步伐,善于用愈加精准化和科技化的手段对著作权予以保护;另一方面要学会运用法律武器、采取法律手段,保护自身著作权权益。有读者会提出疑问,大数据时代著作权的所有权归属到底是个人还是全人类?对此,国家在立法监管层面已开始谋篇布局:一是全面推进《中华人民共和国数据安全法》立法,探索建立数据权属确定等方面的法律法规,为数据交易建立制度性根基。二是加强数据作为生产要素参与分配的机制研究,兼顾效率与公平,推动建立以最优化为目标的要素分配方式,实现政府、企业、个人三方的激励相容。三是确立完善的数据交易监管制度,制定有效的监管措施,执行严格的准入条件,保障数据交易合法合规。

    参考文献:

    [1]百度百科.人工智能[EB/OL].[2020-05-11].https://baike.baidu.com/item/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/9180.

    [2]北绛.“阿尔法狗”之父哈萨比斯:实打实的梦想家[N].中国科学报,2016-04-01.

    [3]人工智能的三大要素:算法、硬件、数据缺一不可[EB/OL].[2020-05-11].https://www.sohu.com/a/337997324_439726.

    [4]百度百科.软件著作权[EB/OL].[2020-05-11].https://baike.baidu.com/item/%E8%BD%AF%E4%BB%B6%E8%91%97%E4%BD%9C%E6%9D%83/3348250?fr=aladdin.

    (作者单位系军事科学出版社)