标题 | 探析软件工程数据挖掘研究进展 |
范文 | 胡金萍 摘要:计算机信息技术日渐发展促使数据挖掘技术在软件工程工作中具有非常重要的作用。在现代化软件工程工作过程中,数据挖掘技术在智能技术开发工作以及自动化技术开发工作中具有非常重要的作用,这就需要做好潜力创新发掘,构建大量数据系统,构建更加完善技术,将数据挖掘技术有效应用于软件工程中。利用数据挖掘技术能够有效完整信息数据分析工作以及整理工作,结合自身特色性来提升软件工程工作有效性。该文对数据挖掘信息作了分析,结合软件工程数据挖掘存在的问题提出有效应用对策,为提升软件工程数据挖掘有效性打下良好的基础。 关键词:软件工程;数据挖掘;分类;问题;对策 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)34-0001-02 随着软件工程工作广泛应用以及逐渐扩展,数据挖掘技术在其中具有非常重要的作用,其能够在海量数据中利用新技术算法以及已有技术实现信息提取、信息分析以及信息表示等等,这样能够促使软件开发者发掘有用信息以及有用知识。数据挖掘技术能够有效提取以及处理软件工程数据,进而利用挖掘算法来解决选择问题。为了能够更加清晰、更加有效掌握软件开发工作过程,软件开发工作人员需要重视数据收集工作,有效提取数据库重要数据,利用数据收集以及数据抽取来实现数据挖掘,应用范围愈加广泛,软件工程应用效果更加理想。 1 数据挖掘技术的分析 计算机信息技术日渐发展以及网络技术日渐发展为用户提取有价值数据提供了重要的支持。利用数据到知识的转化来完善数据挖掘技术。所谓数据挖掘,实际上就是从海量数据中来提取出更加具有利用价值数据,这个过程被称作是捕捞或者是挖掘,实际上就是将验证性驱动分析方式向发现性驱动分析方式的有效转变。在进行炎症性驱动分析过程中,需要设定用户需求存在,进而收集相关数据,这样来不断验证假设成立。从目前发展来看,由于数据存储存在着复杂性并且规模也相对较大,传统验证性驱动方式无法有效发掘数据库可用数据,这就需要有效筛选可用数据,进而有效识别内部信息。在开展数据挖掘时,需要收集相关信息来不断改进自身产品,采用不同软件来开展数据收集工作。实际上,数据挖掘技术包含了多方面的内容,诸如,分类树技术、聚类技术、最优集合的规约技术以及关联发现技术等等,有效利用软件度量的高耦合性以及多维度性来开展特殊化处理方式,在实践中选择有效挖掘技术,进而完成既定工作目标。软件开发上在项目开发工作中,需要从软件检测以及软件控制角度着手,做好工作指标量化处理工作,这样能够使得用户有效了解产品的实际开发过程。从目前来看,度量数据得到了人们越来越高的重视,但是在分析数据以及系统应用方面却仍然存在着问题,因此,需要将软件工程度量工作与数据收集工作有效结合,利用静态性描述,结合图表变化而不断发生变化,提升度量数据应用有效性。 2 软件工程数据挖掘存在的问题 2.1 软件工程数据过于复杂 软件工程数据实际上包含了两方面内容,也就是结构化数据以及非结构化数据。结构化数据主要包含了版本信息以及缺陷报告等方面的内容,非结构化数据则是包含了文档、注释以及数据代码等方面的内容。实际上,结构化数据与非结构数据并不能够完全适用于同一种算法中,但是二者之间存在着非常密切的关联。以缺陷报告为例,缺陷代码段在缺陷报告中具有非常重要的作用,其不仅属于结构化数据内容,也是非结构化数据内容,在软件工程工作中具有非常重要的作用。 2.2 非傳统分析方面存在着非常大的局限性 在进行数据挖掘过程中,需要做好信息转化工作,进而有效传达数据,最终实现信息数据的有效共享。传统工作过程中,信息数据挖掘手段较为单一,主要是利用文字方式以及图表等方面来进行表达,实际上,软件开发商对于信息要求非常高,单一化统计结果无法满足实际工作需求。为了能够有效开发软件,开发工作人员需要有效整合相关信息,结合开发案例、编程模板、系统缺陷等来进行数据挖掘,提升实际的使用功能,实现信息与知识的不断更新,提升信息数据挖掘有效性。 2.3 软件工程挖掘结果评价缺乏统一性 由于受到传统工作理念以及传统工作方式影响促使传统挖掘技术存在着一定的问题。由于传统挖掘技术发展实践相对较长,进而已经构建了较为成熟评价标准。从软件工程的数据挖掘角度分析来看,软件开发工作人员对于信息全面性要求较高,再加上信息自身复杂性使得表示方式存在着一定的差异,这就无法进行系统性比较,实际的评价结果缺乏统一性,评价结果实际应用性并不强。考虑到软件工程项目自身数据量非常大,这就使得项目数据存在着一定复杂性,这就需要结合软件工程实际情况来分析数据,同时还能够有效解决注释问题以及代码问题,这样在一定程度上使得技术分析复杂程度不断加大。此外,由于现代化软件工程对于分析结果精确性要求较高,这就需要做好数据挖掘技术的开发工作以及应用工作,进而实现评价结果统一性。 3 软件工程数据挖掘应用分析 3.1 重视软件开发阶段的数据挖掘技术 在软件开发过程中,数据挖掘技术包含了程序编写以及程序成果两方面内容。在编写程序的过程中,需要在程序结构以及程序功能技术上检索发现有效信息。在代码库汇总选择有效模式,也就是有效利用检索软件的重用模式,能够有效减少手工方式的耗费,只需要输入关键字就能够有效筛选信息,结合用户实际需求来进行智能化培训,进而提升信息有效性。同时还需要重视静态规则的重要性,结合调用关系、重载关系、多重继承关系等来有效记录相关信息,利用递归测试来划分实际工作,进而有效掌握关联度之间可信程度,进而有效排序相关信息,为开发者提供数据信息。此外,还需要充分发挥动态规则在其中的重要作用,利用挖掘对象来设定静态代码,将映射数据存储到数据库中,进而查找缺陷代码,为数据挖掘可靠性提供保障。在进行编程结果修改提交过程中,需要有效排除缺陷代码,同时还能够符合软件开发行业发展要求,在实践过程中运用定位缺陷代码开展测试的方式存在着多种,工作人员需要有效记录执行工作信息并且有效评分其失败率,及时发现缺陷。 3.2 做好软件维护中的数据挖掘 在软件维护工作中,数据挖掘技术对于软件修复以及软件改善工作具有非常重要的作用,对软件缺陷以及软件结构等具有非常重要的作用。在开展软件修复过程中,可以结合缺陷分派来有效评估缺陷程序,进而确定修复级别,进而选择最为有效的缺陷修复方式。在进行缺陷分派过程中,需要将缺陷转化成为文本类型,采取有效措施来进行修复,但是实际准确率并不高,这就需要利用强化检测来完善缺陷报告技术,进而实现自然语言与增设执行信息相似度,进而有效描述软件缺陷,提升软件修复有效性。在软件结构实际优化过程中,需要理解软件设计以及软件程序,利用非编程性质语言来实现定量描述。在软件理解过程中,可以利用软件需求跟踪方式来发现文档设计与文档条目之间的对应关系,继而保证软件功能与软件行为能够符合相关法律规定,并且对重用代码进行获取以及区分,同时还需要重视漏洞检测工作,为软件质量以及软件可靠性提供有效保障,构建软件测试工作程序,有效收集以及清理漏洞库的数据,利用数据挖掘模型来进行验证以及训练,同时还需要进行明确定位以及描述,采用重新测试方面来及时软件漏洞并且及时修复。在软件工程工作过程中,克隆代码在挖掘技术中具有非常重要的作用,能够有效修复重复代码问题,进而为及时修复代码缺陷提供有效保障。在完整程序理解工作之后,需要做好设计工作以及完善工作,为发掘实际传播规律提供支持和保障。软件工程数据愈加复杂使得非传统性需求日渐增加,这就需要不断提高数据挖掘结果评价,进而完善软件工程的数据挖掘算法,检索重用规则以及定位软件缺陷等等,提升数据挖掘技术的可靠性、便捷性以及高效性。 3.3 注重高性能数据挖掘技术开发工作 数据挖掘技术创新在软件开发工作中具有非常重要的作用,现代化软件工程在实际的工作过程中更加关注规则分析工作以及项目检索工作。利用树状网络结构以及静态网络规则来构建链表结构,这样能够做好挖掘软件内部整体性,进而实现数据挖掘技术的创新发展,有利于提升实际检索有效性。在数据挖掘技术应用过程中,需要利用应用才能够实现其价值,这就需要基于现有数据来进行更加准确的预测。传统缺陷定位过程中,需要整合创新性数据挖掘技术来不断健全缺陷定位工作系统,规范实际的表则表达行为,进而构建软件工作模型,表现序列行为以及树行为,实现评价功能自动化发展。总之,利用高性能数据挖掘技术能够快速寻找病毒,这样能够全方位分析和评估病毒数据,进而提升数据分析可行性,提升软件开发安全性能,实现软件工程的动态性发展。 4 结束语 从目前发展来看,我国正是处于数据挖掘发展的起步阶段,仍然需要非常长的时间来进行研究。虽然一部分公司已经构建了软件工程数据框架,但是却并没有实现商业化,仍然需要不断研究。这就需要结合软件工程开发工作、维护工作以及修改工作存在着的问题,不断完善数据挖掘技术,提升数据挖掘实用化,构建自动化信息数据挖掘工作系统。数据挖掘技术不仅能够为软件工程数据提供便利,实际应用价值非常强。因此,需要从过程和技术等角度着手,有效利用数据挖掘技术,为从业工作人员提供更大的发展空间。随着软件工程自动化以及智能化发展促使数据挖掘技术发展空间愈加广阔,实际价值更大。 参考文献: [1] 王刚, 赵玥. 软件工程数据挖掘研究进展[J]. 计算机光盘软件与应用, 2014(7):78-78. [2] 贺玮. 软件工程数据挖掘技术的研究进展[J]. 科技风, 2014(17):141-141. [3] 李思特. 软件工程数据挖掘研究进展[J]. 电子技术与软件工程, 2016(17):167-167. [4] 黄世云. 软件工程数据挖掘研究进展概述[J]. 电子技术与软件工程, 2014(21):89-89. [5] 徐琳, 王寧. 数据挖掘技术在软件工程中的应用分析[J]. 数字通信世界, 2015(8):21-22. [6] 白俊峰, 马静坡, 郭建华,等. 基于数据挖掘的飞行数据分析及仿真研究[J]. 电子技术与软件工程, 2014(9):192-192. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。