大数据环境下的Web网络风险估计

陈晓燕+唐年庆
摘 要: 针对传统大数据评估过程中的Web网络风险评估结果不精准并且速度较慢的问题,提出一种大数据环境下的Web网络风险估计方法。采用特定的风险评估因子进行有效的评估,避免了传统方法中评定项目繁杂、计算量大等因素造成的评估不准的问题。评估过程中使用了特定的评估模型,把传统的加权平均的风险估计方法转变成为非线性映射评估方法,这样能够更加准确的进行风险评估。为了验证设计的大数据环境下的Web网络风险估计的有效性,设计了对比仿真实验。实验结果表明,设计的大数据环境下的Web网络风险估计方法能够有效地解决风险评估过程中的评估结果不准确问题。
关键词: Web网络风险估计; 大数据环境; 风险评估因子; 评估模型
中图分类号: TN711?34; TP469 文献标识码: A 文章编号: 1004?373X(2017)24?0056?03
Abstract: In view of the inaccurate results and slow rate of Web network risk estimation in the traditional big data estimation process, a method of Web network risk estimation in the big data environment is proposed. The specific risk estimation factors are utilized to perform effective estimation, which avoids inaccurate estimation caused by the complexity of the estimation item and big amount of computation in the traditional method. In the evaluation process, the specific estimation model is used to transform the traditional weighted average risk estimation method into the nonlinear mapping estimation method so that the risk estimation can be more accurate. In order to verify the validation of the designed Web network risk estimation in big data environment, the contrast simulation experiment was designed. The experimental results show that the designed Web network risk estimation in big data environment can effectively resolve the problem of inaccurate estimation results in the risk estimation process.
Keywords: Web network risk estimation; big data environment; risk estimation factor; estimation model
伴隨着现代科技的不断推进革新,现代科技的项目也越来越多,能够涵盖的领域也越来越广泛[1]。在进行科技领域的研发过程中,会使用许多没有经过完善体系认证的现代技术以及新兴技术,在使用过程中会存在许多未知的可能性,这些可能性会造成一定的系统失误以及系统偏离,或者是达不到预想的使用效果。有时候会造成工期延误,或者是资金的浪费,这些情况给研制过程带来了极大的不便[2?3]。
采用传统的评估方法进行Web网络风险估计过程中,使用数据模型综合判断法和引入特征因子参数法进行大数据环境下的Web网络风险评估是最简单、直接、有效的方法[4]。数据模型综合判断法需要进行一定的数据测量,在测量过程中数据量极其庞大,并且调查时间较长,还受到一定的条件限制,但是数据模型综合判断法的数据处理能力很强[5?6]。引入的特征因子参数法是方便进行数据测量的方法,这种方法的数据测量采集的准确度高,但是计算能力较弱,并且不能进行自我检验[7]。本文设计的大数据环境下的Web网络风险估计方法,把上述的两种方法有机的进行融合,这样既能够进行快速的数据分析又能够进行准确的数据采集,降低了影响评估风险的因素,提高了在大数据下的Web网络风险估计准确度[8]。
1 Web网络风险估计模型设计
1.1 数据快速采集
Web网络是一种双线记录的网络,Web网络是通过反馈以及应答法方式对数据进行记录的。所以在大型数据下的网络风险评估是必须通过特定因子进行数据的采集,否则很难在网络的一端进行全数据的采集。特定风险特征因子法使用流程如图1所示。
进行数据采集前需要进行属性的定量分析,对大量数据的属性认定能够更加适合Web网络的结构模型如下:
式中:x,y分别为数据的集中属性以及数据的次属性;j,k分别表示Web网络模型和属性节点;w和Q是对应的关系,分别是数据的输入以及输出非线性传输函数。通过式(1)便可以对数据进行属性的衡量。针对大量的数据还需要进行一定的数据标记,这样才能更加快速地进行数据采集,标记过程为:
Web网络通过命令筛选进行标记,P为标记过程值,当属性满足一定条件时,进行标记。通过标记后的数据为示意串符号字符,需要转化为能被识别的十六进制代码,公式为:
式中:T表示统计序列的编号数;η表示限定的条件;r是序列值。为了能够进行快速的风险评估,还需要进行最大连接授权与最小连接授权的计算,计算公式为:
式中:d表示授权能力;H表示数据的属性指标,这样便于进行识别,保证风险评估过程的准确性;是最大的授权值,最小授权值为1。
通过鉴定属性的H平均识别率进行属性的大量采集,平均识别过程为:
式中:pej为Web网络的第j个模板属性中第k标记元素;u是一个限制的值域方便数据的采集;k只能进行1和2的取值,当k为2时,风险评估的数据是0,当k为1时,对应的属性提取值为:
Web网络进行风险评估是需要进行数据的特征提取,本文使用的是特定因子数据采集方法,通过上述标记过后便可进行快速的提取,如下:
Web网络主要的作用是进行数据联想寄存,相当于服务器中的一个运存模块,想要对其进行系统的风险评估,需要对采集的数据进行评估运算。本文通过对Web网络进行特征因子的采集,能够辅助之后的风险评估模型的运算,为风险评估模型提供充足的理论数据。
1.2 使用风险估计模型进行风险评估
在使用风险评估模型之前需要进行供应数据的选择,选定的供应链方便进行属性匹配和估值,其计算公式为:
式中:表示风险影响因子数;E表示理想因子数;A表示数据的充分性因子数。在大数据的情况下,进行风险评估还要考虑到进度风险影响因子,因为数据本身不是没有变化的。进度风险影响因子数:
式中:e为进度风险影响因子参数;b为数据使用进度;a表示本质系数。通过式(8)可反映出数据的流动程度,方便进行数据风险评估。
影响风险评估结果的还有准确性因子数,准确性因子数计算式为:
式中:λ=5.86是一个常值;Q和M分别代表数据的基本属性和非基本属性;e为进度风险因子参数;P为影响风向因子数。通过函转变系数可以得到:
式中:L为风险评估精准系数;D为不确定因子。其是对风险评估的结果进行检验,在确定上述能够影响风险结果的因素时,还存在一些不确定因素,通过式子可以进行不确定因数的评估,使结果更加的精准。通过上述计算完成整体的大数据环境下的Web网络风险估计。
2 试验验证
2.1 参数的设定
為了方便进行大数据环境下Web网络的风险评估,需要对参数进行一定的设置。设置属性指标H值为6;标记坐标系数x,y分别取100,150;平均识别率的k值选择1。为了使计算结果更佳准确,k值参数如下,选择不同系数对应不同关联数:
2.2 风险评估过程
本文使用的是用特定风险特征因子法进行数据的采集,由于设置的标记参数为100,150,因此使用公式进行标记的过程会非常迅速。试验时间对比见图2。
本文使用的特定风险特征因子法进行数据的标记,这样的标记方式可以使用式(6)进行实际计算。其中i≠j∈{0,1,2,…,9}, 由于Web网络采用编码算子进行网络运行,结合本文设计其错误率减小、识别能力得到了很大提升。
为了验证试验的有效性,选定三种方案同时进行试验:第一种方案使用传统方法的专家评估方法;第二种方法采用统计的方法进行风险评估;第三种使用本文设计的方法进行风险评估。表1为三种风险评估结果。
2.3 试验结果分析
通过图2可以看出本文设计的大数据环境下的Web网络风险估计方法能够在大数据下使用较少的时间进行数据的采集。通过表1结果可以看出,本文对Web网络平均风险评估的准确度更好,同时不需要修正。综上所述,本文设计的大数据环境下的Web网络风险估计方法能够解决传统方法中评估结果不精确以及速度慢的问题。
3 结 语
本文设计的大数据环境下的Web网络风险估计方法能够有效地解决传统方法中评估精准度不足以及速度慢的问题。通过本文的设计,希望能够对大数据环境下的Web网络风险估计领域提供更好的评估方法。
参考文献
[1] 赵星,李石君,余伟,等.大数据环境下Web数据源质量评估方法研究[J].计算机工程,2017(2):48?56.
[2] 郑宏,蔡宇翔.大数据环境下入侵风险评估优化模型仿真分析[J].计算机仿真,2016,33(9):292?295.
[3] 杜永红,石买红,史慧敏.大数据环境下p2p网贷平台的风险评估与防范[J].会计之友,2016(22):90?92.
[4] 王闪,谭良.Web大数据环境下的相似重复数据清理[J].计算机工程与设计,2017,38(3):646?651.
[5] 林汉川,张万军,杨柳.基于大数据的个人信用风险评估关键技术研究[J].管理现代化,2016,36(2):95?97.
[6] 李勇,孟小峰,刘继,等.基于小数据的在线用户兴趣长程演化研究[J].计算机研究与发展,2015,52(4):779?788.
[7] 胡亚慧,李石君,余伟,等.大数据环境下的电子商务商品实体同一性识别[J].计算机研究与发展,2015,52(8):1794?1805.
[8] 林海伦,杨晓刚,熊锦华,等.Deep Web数据采集查询构造方法研究[J].计算机科学与探索,2015,9(9):1025?1033.
[9] 李广水,郑滔,宋丁全.面向服务数据挖掘的关键技术在.NET下的实现研究[J].计算机工程与设计,2009,30(20):4654?4657.