标题 | 基于SVM的工控系统安全等级评估方法研究 |
范文 | 苏雪峰 郭燕萍 摘 要: 针对传统的工控系统安全等级评估方法过多依赖专家经验的不足,文章将安全等级评估问题看作是机器学习中的分类问题,提出了面向工业控制系统的安全等级评估要素体系、评估要素量化方法,并将评估要素作为分类特征在训练数据集上训练分类模型,使用分类模型实现安全等级的自动评估。实验表明,所提出的方法体系可行有效,使用支持向量机算法训练的模型在山西省工业企业工控系统安全等级评估中的分类准确率达到了90%,较好地解决了传统方法过多依赖专家的问题。 关键词: 安全等级评估; 评估要素; 支持向量机; 机器学习; 评估模型 中图分类号:TP393.0 文献标志码:A 文章编号:1006-8228(2017)12-46-04 Research on security-level evaluation method of industrial control system based on SVM Su Xuefeng, Guo Yanping (Department of Electronic Business, Business college of ShanXi university, Taiyuan, Shanxi 030031, China) Abstract: Due to the deficiency of traditional security-level evaluation methods of industrial control system relying too much on the experience of experts. This paper puts forward the evaluation factor system and evaluation factor quantitative methods for industrial control system, which regards the security-level evaluation as a classification problem in machine learning field. The classification model is trained on the training data set of taking the evaluation factors as the classification features, and the security level is automatically evaluated by using the classification model. The experiment shows that the precision of the classification model based on support vector machine reaches 90% in security-level evaluation of industrial control system of ShanXi province. The deficiency of traditional methods relying too much on the experience of experts is solved by the method mentioned above. Key words: security-level evaluation; evaluation factor; support vector machine; machine learning; evaluation model 0 引言 随着工业控制网络与企业信息网络的不断融合,工业控制系统的安全管理受到了重大的挑战[1-2]。工控系统安全等级评估是安全管理的重要内容,传统的安全等级评估方法主要有故障树分析法、层次分析法、模糊综合评判法、基于D-S证据理论的评估方法。传统的评估方法过多地依赖专家的经验,根据专家的经验确定评估模型的相关参数,模型的性能较差。 近几年基于大规模数据分析的机器学习评估方法受到众多学者的关注,党德鹏教授提出了一种基于支持向量机的信息安全等级评估方法[3];张利研究员提出了一种基于决策树的评估方法[4];赵冬梅副教授提出了一种基于BP神经网络的评估方法[5-6]。这些方法从理论上证明了机器学习方法在工业控制系统安全等级评估中的可行性,但这些研究的实验数据都是模拟数据,缺乏有效的实践检验。 本文针对山西省工业企业工控系统的安全等级评估问题,按照机器学习的思路,研究评估要素体系构建、评估要素量化、评估模型训练等内容,构建基于支持向量机(Support Vector Machines,SVM)的面向工控系统的安全等级评估模型。一方面从实践的角度进一步研究基于机器学习思路的工控系统安全等级评估方法,另一方面切实解决山西省工业企业工控系统的安全评估问题,同时为其他省份或其他领域的安全等级评估提供一定的借鉴。 1 工控系統安全等级评估 1.1 问题描述 工控系统信息安全等级评估即根据影响企业工控系统信息安全的要素,分析各要素与安全等级之间的关系,建立统一评估模型,由评估模型预测企业的安全等级。其形式化描述为:设为影响工控系统安全的要素值,评估结果Y是关于X的函数,Y的取值可以是连续值也可以是离散值,即Y,建立评估模型就是要确定函数的函数类型及其参数W的值,模型确定之后就能够根据某企业的各项安全要素值算出企业信息系统的安全等级。建立评估模型是安全等级评估的核心。 1.2 评估流程 工业控制系统安全等级评估的一般流程流程如图1所示。 确定评估要素就是根据信息系统自身的特点确定影响信息安全的要素,一般从资产及其价值、系统脆弱性、面临的风险三个方面确定影响因素。评估要素赋值就是利用定量的方法量化每一影响因素。选择评估方法就是根据要素值的分布特征选择与之相适应的评估方法,生成相应的模型参数,从而确定评估模型,最后使用模型进行评估。评估模型的生成往往需要经过多次迭代,对于评估效果较差的模型还需要进行调整,甚至需要更换评估方法。 1.3 评估方法 传统的评估方法(如层次分析方法和模糊层次分析法)认为,评估模型是关于评估要素的线性函数,函数的参数一般由专家确定。基于机器学习的评估方法认为,评估模型是关于评估要素的线性或非线性函数,函数的参数通过学习训练样本而得到。传统的评估方法过渡依赖于专家的经验,线性函数在某些情况下不能准确地反映评估要素与评估结果之间的关系;基于机器学习的方法克服了过渡依赖专家经验的不足,只需要专家确定部分样本的评估结果,机器学习算法根据样本选择合适的模型,并能学习到各要素的权值,模型可能是线性的也可能是非线性的。 2 工控系统安全等级评估要素 2.1 评估要素 信息系统的不安全,既有内部因素,也有外部因素,内因就是信息资源本身具有一定的价值以及系统自身的脆弱性,外因就是信息系统面临外部的威胁如自然灾害、病毒、黑客等。内因是最根本的因素,价值越大的资产越容易受到来自外部的威胁,同样越脆弱的资产越容易受到来自外部的威胁。 根据《工业控制系统信息安全 评估规范 验收规范》(GB/T3097)以及IEC62443-1标准可将工业控制系统安全风险评估要素分为资产、威胁和脆弱性三个方面,每一个因素又细分成若干个子因素[7]。工控系统安全等级评估要素体系如图2所示。 资产具有不同的安全属性,一般包括机密性、完整性、可用性三个方面。资产的安全属性要求越高,表明资产受到安全威胁的可能性越大。 威胁主要是由于系统在权限控制、防病毒、网络攻击防护等方面措施的不足不能防范和抵御来自系统外部的攻击,从而导致系统的安全受到威胁。根据IEC62443-1标准,引起工业控制系统威胁主要因素有非法设备的物理接入、访问权限非法获取、控制信息被篡改、未授权的网络接入等九个方面。每一方面的威胁与系统内部所采取的安全措施有着密切的联系,如非法设备的物理接入与USB端口是否禁用、交换机有无身份认证、监控系统是否到位等因素有密切的关系,换句话说,有一系列完整的安全措施,来自非法设备的物理接入的威胁就会减小。 脆弱性本身不会造成损失,它只是一种条件或环境,可能导致被威胁利用而造成资产损失[8]。脆弱性的出现有各种原因,有管理的原因、有软件的原因、也有硬件的原因。根据《工业控制系统信息安全 评估规范 验收规范》脆弱性共分为安全管理、系统运行维护、网络等八个方面。每一方面又与当前系统的运行状态和管理措施密切相关,如安全管理脆弱性与组织机构是否健全、制度是否完善、是否有应急机制等具体的措施有关。 2.2 评估要素赋值 2.2.1 资产赋值 资产就是在工业控制系统中需要保护的资源,资产可分为有形资产和无形资产,主要有数据、主机、网络、虚拟资产四种具体形式。资产的价值反映了该资产对整个工业控制系统的重要性或该资产受到破坏时对系统影响的大小,其值是一个相对值。一般将资产的安全属性分为五个等级[9],每一等级赋值如表1所示。 2.2.2 威胁因素赋值 威胁的发生主要取决于系统所采取的措施是否完善,措施越完善,受到威胁的可能性越小,损失越小。某一威胁的赋值公式为: 其中Mi=0或1,1表示系统采取了与该威胁相关的第i项措施,0表示系统未采取第i项措施。n表示与该威胁相关的措施数。 2.2.3 脆弱性因素赋值 脆弱性赋值采取与威胁赋值同样的思路,某一方面脆弱性的赋值公式为: 其中,Mi=0或1,1表示导致该脆弱性存在的因素是积极状态或采取了某种措施,0表示导致该脆弱性存在的第i个处理消极状态或未采取相关措施,n表示与该脆弱相关的措施和系统状态数。 3 基于SVM的评估模型 基于机器学习的安全等级评估方法把安全等级评估模型看作是一类分类模型,通过训练大量带标签的样本数据使用机器学习算法学习得到模型,与传统的靠专家经验指定参数差别较大。支持向量机(Support Vector Machines, SVM)是一种通用的机器学习算法,它的一个显著特点是用满足Mercer条件的核函数代替原模式空间的矢量数积运算实现非线性变换,它的实质是将原模式空间变换至一个高维空间,使模式在高维空间中线性可分。 在安全等级是二类的情况下,工业控制系统作为训练样本集记为:{(xi,yi),i=1,2,…,m},其中Xi为第i个训练样本的评估要素向量Xi=(x1,x2,…,xn)T;yi={1,-1},当Xi为正类时,yi=1,当为负类时,yi=-1。使用SVM进行评估的目标就是通过对训练样本的学习,求得评估函数f(x),该函数能在测试集上尽可能正确分类,从而实现对工业控制系统安全等级的分类预测。 4 实验 4.1 实驗数据 本实验数据来源于山西省2016年工业控制系统安全调查数据,从中抽取了100个企业的调查数据作为训练数据集,50个企业的调查数据作为测试数据集;两类数据集的安全级别由专家进行评定,安全级别为两级。实验首先根据本文的评估要素体系,从统计数据中抽取了与威胁因素和脆弱性因素相关的措施和系统运行状态的调查结果,然后根据因素的赋值方法对各类因素进行赋值。要素抽取情况如表1所示。 4.2 实验结果 安全等级使用二级评估,评估结果为1表示相对安全,评估结果为-1表示不安全。评估指标使用分类模型评价广泛使用的查准率(Precision)、查全率(Recall)和F值(F-Measure)。 实验使用LIBSVM工具包进行了模型训练,通过5折交叉验证,最终选取线性核函数作为SVM分类器的核函数,其他参数使用LIBSVM工具包默认参数。为了验证SVM算法与工业系统安全等级评估中使用比较广泛的决策树算法的性能,实验还使用C5.0算法训练了决策树分类模型,两个模型的分类性能如表2所示。 实验结果表明,在现有数据环境下使用SVM算法训练的分类器比C5.0算法训练的分类器更具有优势,分类准确率达到了90%。实验也初步表明使用分类的方法进行安全等级评估是可行的,评估准确率较高,可以实现对企业工控系统安全状态的评估。 5 结论 本文将机器学习中的SVM分类方法应用到了工业系统安全等级评估中,将安全等级评估模型的确定看作是一个分类模型训练问题,通过样本数据由机器学习算法自动确定各个评估要素的权重,克服了依赖专家确定评估要素权重的不足。实验表明,本文提出的要素抽取、赋值、建模方法等可行有效,在山西省工业控制系统调查数据上训练的模型具有较好的性能,从实践应用的角度证明了将机器学习方法应用到工控系统安全等级评估中的可行性。本文使用的实验数据是一组调查数据,由企业相关负责人填写上报,部分数据不够客观,甚至存在虚假的情况,对评估模型的性能和推广应用有一定的影响。在今后的研究或应用中,研究和开发自动化收集工具,在更大范围内使用自动化工具收集相关数据,提高训练数据的质量,进而进一步提高模型的性能。 参考文献(References): [1] Valenzano A,Durante L, Cheminod M. Review of security issues in industrial networks[J].IEEE Transactions on Industrial Informatics,2013.9(1):277-293 [2] ISA99, IEC 62443 Industrial control network&system security standardization[S].ISA,2011. [3] 党德鹏,孟真.基于支持向量机的信息安全风险评估[J].华中 科技大学学报(自然科学版),2010.38(3):46-39 [4]张利,姚轶崭,彭建芬等.基于决策树的智能信息安全风险评 估方法[J].清华大学学报(自然科学版),2011.51(10):1236-1239 [5] 赵冬梅,刘海峰,刘晨光.基于BP神经网络的信息安全风险评 估[J].计算机工程与应用,2007.43(1):139-141 [6]赵冬梅.信息安全风险评估量化方法研究[D].西安电子科技 大学硕士学位论文,2007. [7] 卢慧康,陈冬青.工业控制系统信息安全风险评估量化研究[J]. 自動化仪表,2014,35(10):21-25 [8] 李航,朱广宇.建立健全我国工业控制系统信息安全体系[J]. 智能工业与信息安全,2015.34(1):13-16 [9] 桂若柏.信息安全风险评估模型的研究及其应用[D].重庆大 学硕士学位论文,2014. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。