大型数据库的数据快速定位软件设计与实现

陈苏海


摘 要: 针对大型数据库的数据定位时间缓慢的问题,提出一种大型数据库的数据快速定位方法。引进二分查找算法进行数据查询,同时结合资源描述框架(RDF)三元组方法方便在大型数据库中进行数据定位。根据大型数据库的操作方式以及数据结构进行方位查找换算,可以实现在大型数据库中对数据进行快速定位。实验表明,设计的大型数据库的数据快速定位方法,能够快速、准确地在大量数据中进行数据定位,同时降低了对大型数据库的影响。
关键词: 软件设计; 数据快速定位; 定位软件; 数据查询
中图分类号: TN911?34; TP34 文献标识码: A 文章编号: 1004?373X(2017)24?0091?03
Abstract: A data rapid positioning method for large database is presented in this paper to solve the slow location of data in large database. A binary search algorithm is introduced for data query. The triad method for resource description framework (RDF) is combined for convenient positioning of the data in large database. Orientation seeking conversion is performed according to the operating mode and data structure of large database, which can achieve quick positioning of data in large database. The experiment results show that the designed quick positioning method for data in large database can realize quick and accurate positioning for a large amount of data, and reduce the impact on large database.
Keywords: software design; rapid data positioning; positioning software; data query
0 引 言
近几年,更多的数据信息都是存储在数据库中,大型数据库的建立已经能够通过网络进行实时的信息数据提取,且已代替了原有的集中硬盤以及移动存储[1]。大型数据库相对传统的硬盘存储,其存储信息数据的能力更强,对数据信息保存更加完善,并且通过网络连接可以进行实时的调用,解放实际的占用空间,同时可以解决由于U盘或者移动硬盘丢失的损失。在大型数据库中,为了能更加方便对数据信息进行存储,通常状况下会把文件进行压缩存储。
在对大型数据库的数据定位过程中,虽然大型数据库都设置了相关的索引,但是查找过程中的关键词以及索引信息出现重叠,会很大程度上限制对数据的定位,同时定位的准确度也被降低。
本文设计的大型数据库的数据快速定位软件与传统的方法相比较,能够更加快速、准确地在大型数据库中对数据进行查找,并且能够有效地保证定位过程的准确性,通过试验证明了大型数据库数据快速定位软件的有效性[2?3]。
1 传统大型数据库的数据定位缓慢因素
在大型数据库进行数据存储过程中,一般会划分很多区域,这样方便不同类型的文件进行存储和区分,这样的设置对数据库进行数据的查找定位造成了阻碍。特别是大型数据库中由于数据信息的量十分庞大,即便是根据索引进行查找也无法进行快速查询定位。这给数据的使用以及数据的修改造成了麻烦,传统的数据库数据定位过程中,一般会根据属性进行查找,这样的定位方法会提升定位速度,但是依然无法满足现代对数据快速浏览提取的要求。
本文针对大型数据库设计了一种快速定位的方法,通过本文设计的方法可以实现在大型数据库中对数据快速定位[3]。
2 大型数据库的数据快速定位设计
大型数据库的数据快速定位软件结构图如图1所示。
对大型数据库进行数据定位,其主要取决于对数据的查找能力以及查找方式,传统的查找方式都是通过索引或者关键词进行查找。这种查找方式是逐一的进行对比查找,因此速度极为缓慢[4?5]。为了方便进行查找,本文引入二分查找,这样可以提高对数据的查找速度。假设一个拥有U位的二进制大型数据库,并且数据库中具有S个划分区域,存储的数据通过自然排序进行排列,其中的数据值域都是按照二进制进行的。二分查找算法流程图见图2,使用二分查找法进行查找时,首先需要对数据进行一定的数据排序,其排序公式如下:
排序过后需要进行RDF三元组的相关运算,一个RDF三元组由三个元素(n,N-1,N)组成,其中N是对查找的条件进行限制的元素,N-1是对查找过程进行限制的元素,n是查找模式的系数概括。通过RDF三元组能够进行区域的查找,比传统的逐一查找方便[6?8]。
最终通过模型可以得到矩阵:
式中:Sx表示最终结果;矩阵中的每个元素是坐标系下的全部数据属性[10]。
通过与二分查找法进行结合可以得到矩阵:
式中:A,B,l三个矩阵分别代表数据属性、数据特殊属性、数据位置坐标。这样既能保证查询过程的速度,又能够通过式子检测其准确程度。
通过误差匹配函数进行检验,得到:
通过上述的误差匹配检验又可以排除一批数据,再通过坐标匹配检验得到下列公式:
式中,每一个坐标元素检验都可以是零,如果有非零值,坐标位置便是想要找的数据,执行坐标便可以定位。
通过上述设计的模型,改变以往的逐一定位的方式,能够快速地在大型数据库中找到想要定位的数据。
3 试验验证
为了验证本文设计的大型数据库的数据快速定位软件的有效性,进行了仿真试验,在实验过程中对拥有100 MB信息的大型数据库进行数据定位。首先使用傳统的查找流程,根据设置好的数据关键词“再见”在数据库中进行定位,并记录时间。在使用本文设计的大型数据库的数据快速定位方法进行数据定位。设置数据特殊属性为“再见”,设置传载系数U为7.5;查询属性关联系数ΔX,ΔY分别为5.0,6.0,定位完成直接显示位置以及时间。为了保证试验的有效性,经过多次试验,结果如图3所示。
通过图3可以看出本文设计的大型数据库的数据快速定位方法,对数据进行定位过程所使用的时间明显低于传统方法的定位时间。
通过表1可以看出本文设计的大型数据库的数据快速定位方法能够快速准确地在大型数据库中对数据进行定位,解决了传统方法的定位时间缓慢的问题。
4 结 语
本文设计的大型数据库的数据快速定位软件,通过使用二分查找法以及RDF 三元组方法在数据库中进行查找定位,有效地解决了传统方法的数据定位缓慢的问题。本文的设计能够充分满足现代对数据定位的要求。
参考文献
[1] 张威,鲍丽娜.可快速定位的视频流媒体大数据存储系统[J].科学技术与工程,2014,14(1):239?243.
[2] DO T X, KIM Y. EPD?NEMO: efficient PMIPv6?based distributed network mobility management [J]. Wireless networks, 2015, 21(7): 1?12.
[3] 许应康,彭国金,刘威.飞行试验数据自检测系统软件设计[J].现代电子技术,2015,38(6):31?35.
[4] HORNG G J. Opportunistic content sharing scheme for distributed network in city environments [J]. Wireless personal communications, 2015, 84(4): 1?24.
[5] 肖林京,文艺成,孙传余,等.矿井物流管理和人员定位系统数据库设计[J].工矿自动化,2015,41(4):26?29.
[6] 朱保锋,苏小玲.大型网络异常数据库的快速数据定位模型仿真[J].微电子学与计算机,2016(2):140?143.
[7] 罗国玮,张新长,齐立新,等.矢量数据变化对象的快速定位与最优组合匹配方法[J].测绘学报,2014,43(12):1285?1292.
[8] PANDA M, KHILAR P M. Distributed self fault diagnosis algorithm for large scale wireless sensor networks using modified three sigma edit test [J]. Ad hoc networks, 2015, 25: 170?184.
[9] 刘兴明,杨卓琴.多源数据库中的入侵数据定位方法研究与仿真[J].计算机仿真,2016,33(3):367?370.
[10] TOUBAKH H, SAYED?MOUCHAWEH M. Hybrid dynamic classifier for drift?like fault diagnosis in a class of hybrid dynamic systems [J]. Neurocomputing, 2016, 171: 1496?1516.