一种科技服务资源虚拟化与存储访问方法

    鞠传香 杨宁 丁娜娜 李松

    

    

    

    摘 要:为促进科技资源的跨区域共享及便捷利用,研究了一种科技服务资源虚拟化与存储访问方法。提出包含信息服务/物理资源层、虚拟资源层和资源应用层的科技资源虚拟框架,定义了科技服务资源表示模型。结合科技服务资源的功能属性和非功能属性信息,给出科技服务资源的领域本体和语义定义。设计科技服务资源的统一存储模型,借助Ontop工具实现SPARQL语义查询。测试运行结果显示,构建的科技资源本体和存储模型语义查询正确。该科技资源虚拟框架分层合理,能够有效实现科技资源表达、本体构建和语义定义,且资源存储方法灵活、方便,可有效实现资源的语义查询。

    关键词:科技服务资源;服务虚拟化;资源表示;资源存储;本体;云计算

    DOI:10. 11907/rjdk. 202112????????????????????????????????????????????????????????????????? 開放科学(资源服务)标识码(OSID):

    中图分类号:TP301 ? 文献标识码:A ??????????????? 文章编号:1672-7800(2020)011-0054-06

    A Method for Virtualization and Storage Access of Science and

    Technology Service Resources

    JU Chuan-xiang1,2, YANG Ning1, DING Na-na2, LI Song1

    (1. Qingdao Haida New Star Software Consulting Co., Ltd, Qingdao 266100, China;

    2. School of Computer Science and Technology, Shandong University of Technology, Zibo 255000, China)

    Abstract:In order to promote the cross regional sharing and convenient utilization of science and technology resources, a method for virtualization and storage access of science and technology service resources is proposed. A hierarchical virtualization framework including information service and physical resource layer, virtual resource layer and resource application layer is proposed, and a S&T resource representation model is defined. The domain ontology and semantic definition of S&T service resources are given based on the information of functional attribute and non-functional attribute of S&T service resources. After defining a unified storage model, SPARQL semantic query is executed with the help of Ontop tool. The results show that semantic query has higher accuracy. thus we can draw the conclusion that the hierarchical virtualization framework is reasonable, which can effectively realize the expression, ontology construction and semantic definition of scientific and technological resources; the resource storage method is flexible and convenient, and can effectively realize the semantic query of resources.

    Key Words:S&T service resource; service virtualization; resource representation; resource storage; ontology; cloud computing

    0 引言

    科技资源对科技产业和区域经济发展起到支撑性作用,随着区域一体化的不断推进,跨区域科技协作已十分普遍。在此情况下,全链条、跨区域的科技服务需求尤为迫切[1]。当前各个城市区域的科技服务资源仍存在分散不均、效率低下、资源信息不统一、信息平台间缺乏共享渠道等问题,已无法适应社会经济发展需求[2]。为突破科技服务现状,提供跨区域、便捷、高效的科技服务,并促进科技服务向高端迈进,需构建新型科技服务云平台。

    基于云计算的科技服务平台是为科技服务用户和管理者提供的一种新型服务模式,通过构建跨网络的虚拟资源池动态配置业务组合,满足用户复杂、个性化的科技服务需求。科技资源具有类型多样性、跨域性、异质性等特点,使得科技服务云平台中的资源共享与利用变得更加复杂[3]。为此,本文提出一种科技服务资源虚拟化与存储方法,通过资源抽象、表示建模、领域知识本体定义、建模存储、映射规则定义等处理过程,将各类科技服务资源存入集中统一定义与管理的资源池中,解决不同服务资源之间的异构性问题,最终实现科技资源的集成与共享。

    1 相关研究

    虚拟化是对计算机资源的抽象,通过对异质、自治资源的聚合,为用户和应用提供统一的集成操作平台,达到提升资源利用率的目的[4]。早期,虚拟化技术主要应用于操作系统、存储和网络资源等方面。近年来,随着云计算、物联网技术的发展,虚拟化技术在智能制造、智慧物流和智慧城市等领域得到了广泛应用,在提升系统灵活性和使用价值方面发挥了重要作用。在科技服务领域,虚拟化技术将各类科技服务资源聚集到资源池中,不仅可以降低区域内科技服务资源的获取难度,还可通过服务资源组合促进区域内科技服务资源的共建共享与合理配置,降低资源获取成本,提高科技服务资源利用率等[5]。资源虚拟化一般包括两个阶段:①分析资源特征,定义服务资源统一表达模型和存储模型;②采用Web服务描述技术封装资源。本文重点关注第一阶段。

    近年来,很多学者也对资源虚拟化技术进行了研究。如Liu等[6]提出一种面向服务的可扩展信息物理云制造(Cyber-Physical Manufacturing Cloud,CPMC)平台体系结构,利用虚拟化技术对异质、复杂的制造资源进行汇聚与封装,应用于多种不同的制造场景,实现跨区域制造协同;Li等[7]基于云计算与物联网技术提出一种新型物流服务模式,研究了物流服务平台的资源虚拟化和服务封装,实现了支持服务质量约束的物流服务选择算法;Ogawa等[8]针对智慧城市中物联网平台汇聚处理多源传感设备数据时存在的问题,采用物联网设备虚拟化方法,借助微服务共享和动态资源分配技术,实现了传感设备资源数据的采集与汇集;Vichare等[9]提出一种制造设备资源模型UMRM,该模型不仅定义了产品设计、几何结构、生成过程等信息,还具有设备制造过程规划与决策等自动化支持能力。

    在科技资源信息标准化方面,文献[2]对科技资源的内涵和分类进行定义与建模,分析了数字科技资源集成技术,提出基于语义本体的科技资源集成框架;文献[10]以多领域、多渠道、多类型的海量科技资源为研究对象,在分析科技资源共性特征的基础上,给出了科技资源核心元数据规范;文献[5]对科技服务资源池作为虚拟化容器进行资源集成的可行性进行分析,提出一种科技服务资源池中科技服务资源集成与关联优化的方法流程。

    从上述文献来看,资源虚拟化技术已在多个领域进行了应用,但在科技服务领域的应用相对较少,已有文献也仅是对科技服务虚拟资源池的构建进行可行性分析和方法指导。尽管针对科技服务资源信息元数据、知识语义等模型的研究都取得了较多成果,但鲜有文献对科技服务资源语义本体及实例存储进行完整的设计和实现。本文则将资源虚拟化技术引入科技服务领域,构建科技服务资源本体概念和存储模型,实现语义查询映射。

    2 科技资源虚拟化

    资源虚拟化是资源共享和动态分配的關键[7]。科技资源地理分散、结构不一致,要实现跨区域、跨系统、跨结构的资源共享,需要根据各类资源特性构造统一的资源描述模型。将不同系统和不同类型的科技资源抽象为粒度较细的概念及关系,使异构资源描述模型映射为物理或IT服务资源形式,实现跨系统的资源集成。

    2.1 科技资源虚拟化结构

    在科技资源虚拟化过程中,需使用一组属性描述科技资源,标识科技资源的功能属性和非功能属性。异构科技资源有不同的描述属性,需对科技资源的描述属性进行总结,找出资源间的共有属性,并对资源专有属性使用统一的描述方式,以方便系统统一管理与调度服务资源。本文提出的科技资源虚拟化层次结构包括信息服务/物理资源层、虚拟资源层和资源应用层,如图1所示。

    信息服务/物理资源层主要包括科技服务、知识产品、科技资讯、科研仪器和实验器具等各类科技资源,这些分布式科技资源通过互联网、无线通讯技术,以及传感器及GPS等物联网感知技术,以Web接口的形式接入科技服务云平台。

    虚拟资源层则根据科技服务资源描述规范对信息服务/物理资源进行形式化定义,分析科技资源属性信息,统一定义科技服务资源领域本体与语义,构建存储模型和映射规则。通过封装服务资源查询、管理等接口,实现对科技服务资源的访问。

    资源应用层通过调用发布的Web服务接口实现科技服务资源搜索等功能。

    2.2 科技资源表示模型

    科技资源是科技云服务系统中搜索的最小单元,其表示模型是科技资源查找、匹配、推荐的基础,本文中科技资源表示模型定义如下:

    TRes={TR_Id,TR_Property,TR_Interface}

    其中,TR_Id表示所属单位科技资源的唯一标识,在科技服务云平台中,每个服务资源对应一个唯一的由云服务平台创建与维护的通用资源标识符URI。TR_Property表示科技服务资源属性信息,其模型可表示为:TR_Property={BaseInfo,FuncProp,QosProp}。其中,BaseInfo表示科技资源基本信息,包括资源名称、资源URL、资源提供者、提供日期、资源状态等。服务资源包括功能和非功能两方面属性,FuncProp表示科技资源功能属性,包括科技服务、知识产品、科研仪器、科研机构等资源类型;QosProp表示科技资源的非功能质量属性信息,可用于服务资源搜索时的质量因素选择。TR_Interface表示科技资源操作接口,包括资源查询、编辑和管理等。科技服务提供者通过开放接口将科技资源注册到服务系统中,并对科技服务资源进行统一描述,供科技服务用户查询与调用。

    3 科技资源本体构建

    本体定义为“概念化的显式规范”,用可被机器和人类共同理解的模型描述一个特定领域,模型中定义了领域概念与其之间的关系[11]。通过提供一组公共关键字以定义与领域相关概念,关键字描述了每个概念的属性。同时,通过描述概念之间的关系定义现实意义。本体概念可按层次结构进行组织,例如:超类/子类或父/子关系等。

    本体模型的构建不仅可揭示科技信息数据之间的内在联系,明确表达知识含义,还可增强知识内容的共享性和可重用性[12]。本文定义的科技资源领域本体如图2所示,图中包括科技资源功能属性、非功能QoS属性及其之间的层次关系,表1列出了科技资源本体类及说明。

    科技资源按照功能可划分为科技服务、知识产品、科技资讯、科研仪器、实验装置、科研机构、人力资源7大类。其中,科技服务包括科技查新检索、科技咨询、工业设计、技术评估、技术开发、成果转化等;知识产品包括科技论文、专利、技术标准、知识数据库等;科技咨询包括政策法规、科研进展、行业资讯等;科研仪器包括可用设备、仪器、系统平台等;实验器具包括实验试剂、耗材、种质资源等;科研机构包括科技服务机构、大学、企业研究机构、实验室、中试基地、工程研究中心等;人力资源包括科技服务人员、科技活动人员等。

    科技资源按照QoS特征分为业务能力和技术能力两类。其中,业务能力包括用户满意度/声誉、经济因素(免费/固定付费/动态付费)、互操作性(容易/适中/难)等;技术能力包括性能(响应时间/吞吐量/计算精度)、稳定性(带宽/延迟)、健壮性(弱/一般/强)、安全能力(加密/VPN/无)、可用性(修复时间)等。

    构建本体模型主要是设计概念类集合、属性集合和关系集合,概念类层次结构定义了科技资源实体的整体框架。为进一步描述概念类的内部关系,需用数值属性Datatype Property描述类性质,例如定义“专利”的属性,包括专利权人、授权日期、名称、授权专利号等属性信息,并用对象属性Object Property描述概念类之间的语义关系。以科技成果转化业务作为场景,如某科研机构拥有与科研成果A相关的专利,以及与该专利A相关的科研仪器、平台、专家等科技资源可供需求方单位使用。该业务中科技资源功能本体关系如图3所示。其中,实验室机构与专利资源之间具有“拥有版权(hasCopyright)”的关系,实验室机构与专家资源之间具有“工作于(workAt)”的关系,专利与系统平台、科研仪器及科研专家之间具有“相关(relateTo)”关系。该业务的非功能本体关系如图4所示,相关科技资源均具有资源基本信息(hasBaseInfo),实验室机构资源具有QoS声誉属性(hasReputationProp),專利和科研专家资源具有QoS经济因素属性(hasEconomicsProp),系统平台资源具有QoS性能 (hasPerformanceProp)和经济因素属性(hasEconomicsProp),科研仪器具有QoS稳定性属性(hasStabilityProp)。

    4 科技资源存储与访问映射

    4.1 科技资源存储模型

    本体和数据库模型均可表达与存储知识,但两种模型关注点不同[13]。本体通过高层抽象的方式重点解决异质系统交互、知识共享和信息融合等问题,支持概念之间的语义表达,关注数据内涵;数据库重点解决高性能数据存储、便捷查询等数据管理问题,可提供结构化的存储库,关注实例数据存储。考虑两种模型的优势,本文针对科技资源存储,采用两种模型相结合的方式,利用关系型数据库存储科技资源实例以及相关的非功能性数据,通过功能本体和非功能本体提高语义查询效率。

    在关系型数据模型构建过程中,每个科技资源功能本体用4个字段表示,其中主键字段代表功能本体概念的唯一性,其它3个字段分别对应本体概念基本信息、业务质量属性和技术质量属性。例如,科技成果转化业务场景中的数据模型如图5所示,5个功能本体均包括1个主键属性与3个外键属性,3个外键分别对应功能本体实例的基本信息ID、业务质量ID和技术质量ID。数据模型表结构中的主键均按照本体概念名加_ID的规则进行命名。

    4.2 科技资源访问映射

    基于本体的科技资源访问优势是可以进行语义检索,避免仅依靠字面匹配造成的误差,提高资源发现与服务能力[14]。要实现从关系数据库实例数据中进行语义查找,必须建立本体检索到数据库的访问映射。本文建立的映射关系过程如图6所示。

    图6中使用Ontop工具完成从本体检索到数据库实例的映射访问。Ontop是一个虚拟知识图形系统,可将现有关系数据库虚拟化为知识图谱,具有将SPARQL查询转换为SQL查询的能力[15]。实现语义查找的关键是定义科技资源访问映射规则,这些规则将本体概念与数据库表属性建立链接关系,将存储在数据库中的数据转换为RDF三元组集合,每个三元组包括资源URI引用、属性和属性值。例如,概念Reputation的每个本体实例对应两个三元组,资源URI引用表示为“”,或者添加前缀“:”表示为“:Reputation_ID_10”,属性表示为“rdf:type”和“:QoSValue”,属性值表示为“:Reputation”和“8”,如表2所示。

    Ontop支持SPARQL语法,可将SPARQL查询映射为关系数据库SQL查询,实现对数据实例的查询。表3列出了科技成果转化业务场景中科技资源访问映射的部分规则,其中“:”代表前缀“<http://www.semanticweb.org/str#”,“{?}”代表实例的主键序号。

    5 测试运行

    本文使用Protégé工具进行科技资源本体建模,并使用微软的关系型数据库SQL Server存储本体实例。Protégé安装Ontop插件后,在工具栏中增加了用于数据源和规则映射配置的Ontop Mappings选项卡与用于查询管理的Ontop SPARQL选项卡。配置数据源连接参数后,通过Mapping manager加入映射规则。从运行结果来看,构建的科技资源本体和存储模型可以有效实现资源的语义查询。

    6 结语

    科技资源集成与共享是国家科技服务发展的基础,本文定义了科技服务资源虚拟池框架,分析了科技服务资源的功能属性和非功能属性,给出了科技服务资源的领域本体和语义定义,研究了科技资源实例存储技术,定义了科技服务资源的统一存储模型和SPARQL语义查询映射规则,为跨区域科技服务共享云平台建设提供了有力支撑。下一步工作将结合业务场景完善领域本体与存储模型,研究映射规则的自动化定义算法,提高工作效率,研究科技服务资源选择与搜索技术,封装资源查询与管理接口,搭建科技服务资源共享云平台。

    参考文献:

    [1] WU H C, HU S Y. An overview of cross-regional collaborative innovation[C]. 2019 3rd International Conference on Advanced Education and Management Science,2019:277-282.

    [2] 宫萍,王理,张辉,等. 基于语义本体的科技资源集成建模研究[J]. 标准科学,2019(3):36-40.

    [3] 王宏起,程淑娥,李玥. 大数据环境下区域科技资源共享平台云服务模式研究[J]. 情报理论与实践,2017,40(3):42-47.

    [4] SAHOO J,MOHAPATRA S,LATH R. Virtualization: a survey on concepts, taxonomy and associated security issues[C]. Second International Conference on Computer & Network Technology,2010:222-226.

    [5] 李宗俊,陈文杰. 区域科技服务资源集成与关联研究[J]. 中国科技资源导刊,2019,51(6):1-5,58.

    [6] LIU X F,SHAHRIAR M R,Al SUNNY S M N,et al. Cyber-physical manufacturing cloud: Architecture, virtualization, communication, and testbed[J]. Journal of Manufacturing Systems,2017,43:352-364.

    [7] LI W,ZHONG Y,WANG X,et al. Resource virtualization and service selection in cloud logistics[J].? Journal of Network and Computer Applications, 2013, 36(6):1696-1704.

    [8] OGAWA K, KANAI K, NAKAMURA K, et al. IoT device virtualization for efficient resource utilization in smart city IoT platform[C]. 2019 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops), 2019: 419-422.

    [9] VICHARE P,NASSEHI A,KUMAR S, et al. A unified manufacturing resource model for representing CNC machining systems[J].? Robotics and Computer-Integrated Manufacturing,2009, 25(6):999-1007.

    [10] 宋佳,高少华,杨杰,等. 科技资源元数据的关联与推荐方法[J]. 中国科技资源导刊,2017,49(5):37-44,103.

    [11] STAAB S, STUDER R. Handbook on ontologies (international handbooks on information systems)[M]. Berlin:Springer-Verlag,2004.

    [12] WONGTHONTHAM P,ABUSALIH B.? Ontology-based approach for semantic data extraction from social big data: state-of-the-art and research directions[J].? Journal of Organizational Computing & Electronic Commerce, 2018,28(4):354-377.

    [13] SIR M, BRADAC Z, FIEDLER P. Ontology versus database[J].? IFAC Papersonline, 2015, 48(4):220-225.

    [14] 宋培彥,陈白雪,贤信. 科技专家信息语义模型构建及实证研究[J]. 情报理论与实践,2017,40(9):123-128.

    [15] Free University of Bozen-Bolzano.Ontop[EB/OL]. https://ontop.inf.unibz.it/.

    (责任编辑:黄 健)

    0 引言

    纯电动汽车的应用可以缓解能源短缺、环境污染等问题,因此各企业越来越重视纯电动汽车生产、技术和销售方面的创新。纯电动汽车销售量也日益增长,根据前瞻产业研究院报告显示,2019年上半年纯电动汽车全球销售量增长了92%,达到76.5万辆,中国市场销售量为43.07万辆,同比增长了111%。由销量数据可以看出,纯电动汽车市场发展前景是可观的。因此,纯电动汽车研发与推广依然是新能源汽车重要的研究方向。近年来在政府与企业的共同努力下,电动汽车在生产成本、行驶里程、资金投入与使用等关键问题上获得了重大突破[1]。对纯电动汽车月度销售量进行预测,能为企业科学制定汽车产量提供依据。

    影响电动汽车销售量的因素众多,且复杂多变,通常具有非线性变化特性,导致传统线性映射模型对纯电动汽车销售量的预测精度较低[1]。因此,很多学者采用基于非线性模型的预测方法。如董丽丽等[2]利用LSTM神经网络对煤矿突水情况进行预测;刘璐等[3]利用SVM对烟草销售量进行预测等。为了实现更好的预测效果,将多种预测方法相结合也成为当前的研究热点[4-5]。如李军怀等[6]提出借助马尔可夫链修正指数平滑的方法预测短时交通流量,以提高预测精度;黄羹墙等[7]首先利用BP神经网络模型对短期电价进行初步预测,再用马尔可夫模型对预测误差进行修正,可提高短期电价预测精度;石萍等[8]考虑电动汽车销量的季节性变化因素,运用组合模型预测新能源电动汽车销售量;周彦福等[9]先利用灰色关联分析8种影响销售量的因素,再构建果蝇算法优化灰色神经网络(FOA-GNN)预测模型进行新能源汽车月度销售量预测,通过对比预测结果,显示该模型具有较高的预测精度。

    在之前的研究中,提取纯电动汽车销售量影响因素时并未考虑消费者预期指数、消费者满意指数、企业家信心指数和煤油电价格指数等因素,本文将这些因素考虑在内,利用BP神经网络预测纯电动汽车销售量,再根据马尔科夫链修正预测结果,以进一步提高预测精度。

    1 BP神经网络与马尔科夫模型

    1.1 BP神经网络模型

    BP神经网络是1986年由以Rumelhart&McCelland为首的科学家小组提出的,是一种利用误差逆传播算法训练的多层前馈网络,因其具有简单易行、计算量小、并行性强等优点,成为目前应用比较广泛的一种神经网络模型[10-11]。BP神经网络由输入层、隐含层和输出层组成(见图1)。在网络训练过程中,通过将输出层与实际输出样本之间的误差经过各隐含层反向传递到输入层,逐层计算各层神经元误差,然后根据误差梯度下降法调节各层权值和阈值,使修改后网络最终输出能接近期望值[12-14]。

    1.1.1 信号前向传播过程

    设网络输入模式为xx1,x2,…,xnT,隐含层有h个单元,其输出为y=(y1,y2,…,yh)T,输出层有m个单元,其输出为z=(z1,z2,…,zm)T,目标输出为t=(t1,t2,…,tm)T,隐含层到输出层的传递函数为f,输出层传递函数为g。计算公式如下:

    yj=fi=1nwijxi-θ=fi=0nwijxi? ? ? ? ?(1)

    式中,yj表示隐含层第j个神经元的输出,w为权重向量,w0j=θ,x0=-1。f为激活函数,一般选取s型函数。

    fx=11+e-ax,(0<fx<1)? ? ?(2)

    zk=g(j=0hwjkyj)? ? ? ? ? (3)

    式中,zk表示输出层第k个神经元的输出。此时网络输出与目标输出的误差为:

    ε=12k=1m(tk-zk)2? ? ? ? ? ? ? ? ? ? ? ? (4)

    由于负梯度方向是函数值减小最快的方向[11],因此可设定一个步长η,每次沿负梯度方向调整η个单位,即每次权值的调整为:

    Δwpq=-η?ε?wpq? ? ? ? ? ? ? ? ? ? ? ? ? ? (5)

    其中,η为学习速率。

    1.1.2 误差反向传播

    隐含层到输出层的权值调整迭代公式为:

    wjkt+1=wjkt+ηδkyj? ? ? ? ? ? ? ? ?(6)

    從输入层到隐含层的权值调整迭代公式为:

    wijt+1=wijt+ηδjxj? ? ? ? ? ? ? ? ? (7)

    1.2 马尔科夫链预测模型

    马尔科夫过程用于研究一个系统的状况及其转移,是一种常见的简单随机过程。其通过对不同状态初始概率以及状态之间转移概率的研究,确定状态变化趋势,从而达到预测未来的目的[10],具有无后效性、遍历性和过程随机性。应用马尔科夫(Markov)模型对BP神经网络模型预测数据进行处理,可提高预测精度。

    1.2.1 马尔科夫链

    时间和状态都是离散的马尔科夫过程称为马尔科夫链[10]。假设马尔科夫链有n个状态,则状态概率向量为α=α1,α2,…,αn,公式为:

    αn=α0pn? ? ? ? ? (8)

    式中,αn、α0分别表示n时刻和初始时刻的状态概率向量,p表示状态转移概率矩阵。

    1.2.2 初始状态概率与状态转移概率矩阵

    (1)初始状态概率。用Mi表示Ej型状态出现的总次数,则初始概率为:

    α(0)i≈Fi=Mii=1nMi(i=1,2,…,n)? ? ? ? ? (9)

    (2)状态转移概率。如果研究对象处于Ei,下一步转移到Ej,此过程共发生nij次,则:

    pij=nijni,i,j=1,2,…,n

    0≤pij≤1,j=1npij=1? ? ? ? ? ? ?(10)

    (3)状态转移概率矩阵。根据状态转移概率得出状态转移概率矩阵为:

    P=P11P12?P1nP21P22?P2n?Pn1?Pn2???Pnn,

    0≤pij≤1,j=1npij=1? ? ? ? ? ? ? ? ? ? ? ? ? ? (11)

    1.2.3 馬尔科夫链修正BP神经网络预测值

    将BP神经网络预测值与实际值的相对误差划分为不同状态,αn为时刻n的状态概率向量,αn中最大概率值对应的状态Ej为预测时刻所对应的状态,则修正后的预测结果为:

    e*=ea+eb2? ? ? ? ? ? ? ? ? ? ? (12)

    Q*=Qx(1+e*)? ? ? ? ? ? ? ? ?(13)

    式中,ea、eb为状态区间上下界,Qx为BP神经网络预测的纯电动汽车销售量。

    2 数据来源及预处理

    数据样本的选取是影响BP神经网络模型预测结果的关键因素,因此选取纯电动汽车销售量的影响因素要与纯电动汽车销售量具有高相关性。煤油电价格指数和中国汽油价格可反映纯电动汽车销售趋势,居民消费价格指数可反映居民消费水平的高低,消费者满意指数与预期指数代表着消费者的满意度与期望,企业家信心指数影响企业管理模式与电动汽车产销模式,这些因素都能综合反映纯电动汽车销量情况。因此,本文选取中国居民消费价格指数、煤油电价格指数、消费者满意指数、消费者预期指数、消费者信心指数、中国汽油价格、企业家信心指数作为影响纯电动汽车销售量的主要因素。

    本文通过东方财富网数据中心搜集到2017年1月-2019年9月各影响因素相关数据,并在前瞻产业研究院查询到33个月份的纯电动汽车销售量。采取的样本数据中各因素评价标准不同,通常具有不同的量纲和数量级,需要对原始数据进行标准化处理以确保结果的可靠性。而且本文BP神经网络采用s型函数,通过归一化能够防止神经元输出饱和现象,使网络快速收敛。因此,首先在MATLAB中对以上7个影响因素进行数据归一化处理到[0,1]区间。

    x'=x-xminxmax-xmin? ? ? ? ? ? ? ? ? (14)

    3 模型分析与修正结果

    BP神经网络为缩短网络训练时间与提高训练精度,通常选择较少的隐含层结点数[7]。本文选取学习率lr=0.000 1,最大训练次数epochs=10 000,收敛误差goal=1e-3,隐含层神经元结点数为9,训练函数为trainlm。训练网络中将输入数据的70%作为训练集,15%作为测试集,15%用来进行模型预测[15],仿真结果如图2所示。运用BP神经网络对2017-2018年24个月的纯电动汽车销售量进行预测,其实际值与预测值相对误差如表1所示。将相对误差分为6个状态,分别为:E1:-35%~-20%,E2:-20%~-5%,E3:-5%~10%,E4:10%~25%,E5:25%~40%,E6:40%~55%。

    根据相对误差划分状态,利用马尔科夫进行优化,由上述的马尔科夫模型可求得一次状态转移概率为:

    P1=03/401/92/94/91/30001/20011/6010? 01/401/901/9000000000100? ? ? ? ? ? (15)

    将2018年12月作为初始状态α0=010000,根据马尔科夫原理可求得2019年1月状态为α1=α0?P1=1/92/94/91/901/9,则所处状态为E3,对应相对误差为(-5%+10%)/2=2.5%,Markov-BP神经网络模型预测值为6.35×1+2.5%=6.51。同理,利用Markov-BP神经网络模型可得出2019年2月-9月的纯电动汽车预测值,如表2所示。

    从BP神经网络模型与Markov-BP神经网络模型对纯电动汽车销售量预测的相对误差对比可以发现,Markov-BP神经网络模型预测值的相对误差更小,因而提高了预测准确度。

    4 结语

    在提倡绿色发展的大背景下,政府支持纯电动汽车的研发与推广,但现阶段纯电动汽车的销售情况并不乐观。因此,对纯电动汽车销售量进行准确预测,可以减少资源浪费,降低企业成本。本文选取影响纯电动汽车销售量的7个关键因素,利用BP神经网络模型对现有数据进行训练,用测试好的模型预测2019年1月-9月纯电动汽车销售量,再用马尔科夫(Markov)模型修正其预测值。通过对比发现,Markov-BP神经网络模型的预测精度更高,可有效弥补BP神经网络预测的不足。但本文选取的纯电动汽车销售量影响因素不够全面,未结合纯电动汽车价格及相应技术指标进行综合考虑。因此,充分考虑这些影响因素,并找到更合适的纯电动汽车销售量预测模型,是下一步的研究方向。

    参考文献:

    [1] 孙婷婷,沈毅,赵亮. 一种基于BP神经网络的房价预测模型[J]. 电脑知识与技术,2019,15(28):215-218.

    [2] 董丽丽,费城,张翔,等. 基于LSTM神经网络的煤矿突水预测[J]. 煤田地质与勘探,2019,47(2):137-143.

    [3] 刘璐,丁福利,孙立民. 基于SVM的烟草销售量预测[J]. 软件导刊,2016,15(11):134-137.

    [4] 张茜,冯民权. 基于BP神经网络马尔科夫模型的漳泽水库水质预测[J]. 黑龙江大学工程学报,2018,9(2):38-44.

    [5] 王保贤,刘毅. 基于灰色BP神经网络模型的人力资源需求预测方法[J]. 统计与决策,2018,34(16):181-184.

    [6] 李军怀,高瞻,王志晓,等. 基于指数平滑和马尔可夫链的短时交通流量预测[J]. 计算机系统应用,2013,22(12):132-135.

    [7] 黄羹墙,杨俊杰. 基于BP神经网络与马尔可夫链的短期电价预测[J]. 上海电力学院学报,2017,33(1):1-3,10.

    [8] 石萍,黎俊辉,刘洪. 新能源电动车销量预测模型的应用[J]. 辽宁科技大学学报,2016,39(5):395-400.

    [9] 周彦福,王红蕾. 我国新能源汽车月度销售量预测模型研究[J]. 软件导刊,2019,18(8):149-153.

    [10] 陈娟,曹沁愉. 基于马尔科夫链对BP神经网络法残差修正模型的短期风电功率预测[J]. 电力与能源,2017,38(5):567-570.

    [11] 王奕翔,陈济颖,王晟全,等. 基于改进型RF-BP神经网络的房地产价格预测[J]. 工业控制计算机,2019,32(10):122-124.

    [12] 陈广银,蔡灏兢,姜欣. 马尔可夫修正的BP神经网络在PM2.5预测中的应用[J]. 能源环境保护,2017,31(5):8-11.

    [13] WANG H,XU L,WANG X. Outage probability performance prediction for mobile cooperative communication networks based on artificial neural network[J]. Sensors,2019,19(21):4789-4805.

    [14] 徐森. 基于BP神經网络的甘肃省公路客运量预测方法[J]. 交通与运输,2019,35(5):28-31.

    [15] 王筱欣,高攀. 基于BP神经网络的重庆市房价验证与预测[J]. 重庆理工大学学报(社会科学),2016,30(9):49-53.

    (责任编辑:黄 健)

    科技资源对科技产业和区域经济发展起到支撑性作用,随着区域一体化的不断推进,跨区域科技协作已十分普遍。在此情况下,全链条、跨区域的科技服务需求尤为迫切[1]。当前各个城市区域的科技服务资源仍存在分散不均、效率低下、资源信息不统一、信息平台间缺乏共享渠道等问题,已无法适应社会经济发展需求[2]。为突破科技服务现状,提供跨区域、便捷、高效的科技服务,并促进科技服务向高端迈进,需构建新型科技服务云平台。

    基于云计算的科技服务平台是为科技服务用户和管理者提供的一种新型服务模式,通过构建跨网络的虚拟资源池动态配置业务组合,满足用户复杂、个性化的科技服务需求。科技资源具有类型多样性、跨域性、异质性等特点,使得科技服务云平台中的资源共享与利用变得更加复杂[3]。为此,本文提出一种科技服务资源虚拟化与存储方法,通过资源抽象、表示建模、领域知识本体定义、建模存储、映射规则定义等处理过程,将各类科技服务资源存入集中统一定义与管理的资源池中,解决不同服务资源之间的异构性问题,最终实现科技资源的集成与共享。

    1 相关研究

    虚拟化是对计算机资源的抽象,通过对异质、自治资源的聚合,为用户和应用提供统一的集成操作平台,达到提升资源利用率的目的[4]。早期,虚拟化技术主要应用于操作系统、存储和网络资源等方面。近年来,随着云计算、物联网技术的发展,虚拟化技术在智能制造、智慧物流和智慧城市等领域得到了广泛应用,在提升系统灵活性和使用价值方面发挥了重要作用。在科技服务领域,虚拟化技术将各类科技服务资源聚集到资源池中,不仅可以降低区域内科技服务资源的获取难度,还可通过服务资源组合促进区域内科技服务资源的共建共享与合理配置,降低资源获取成本,提高科技服务资源利用率等[5]。资源虚拟化一般包括两个阶段:①分析资源特征,定义服务资源统一表达模型和存储模型;②采用Web服务描述技术封装资源。本文重点关注第一阶段。

    近年来,很多学者也对资源虚拟化技术进行了研究。如Liu等[6]提出一种面向服务的可扩展信息物理云制造(Cyber-Physical Manufacturing Cloud,CPMC)平台体系结构,利用虚拟化技术对异质、复杂的制造资源进行汇聚与封装,应用于多种不同的制造场景,实现跨区域制造协同;Li等[7]基于云计算与物联网技术提出一种新型物流服务模式,研究了物流服务平台的资源虚拟化和服务封装,实现了支持服务质量约束的物流服务选择算法;Ogawa等[8]针对智慧城市中物联网平台汇聚处理多源传感设备数据时存在的问题,采用物联网设备虚拟化方法,借助微服务共享和动态资源分配技术,实现了传感设备资源数据的采集与汇集;Vichare等[9]提出一种制造设备资源模型UMRM,该模型不仅定义了产品设计、几何结构、生成过程等信息,还具有设备制造过程规划与决策等自动化支持能力。

    在科技资源信息标准化方面,文献[2]对科技资源的内涵和分类进行定义与建模,分析了数字科技资源集成技术,提出基于语义本体的科技资源集成框架;文献[10]以多领域、多渠道、多类型的海量科技资源为研究对象,在分析科技资源共性特征的基础上,给出了科技资源核心元数据规范;文献[5]对科技服务资源池作为虚拟化容器进行资源集成的可行性进行分析,提出一种科技服务资源池中科技服务资源集成与关联优化的方法流程。

    从上述文献来看,资源虚拟化技术已在多个领域进行了应用,但在科技服务领域的应用相对较少,已有文献也仅是对科技服务虚拟资源池的构建进行可行性分析和方法指导。尽管针对科技服务资源信息元数据、知识语义等模型的研究都取得了较多成果,但鲜有文献对科技服务资源语义本体及实例存储进行完整的设计和实现。本文则将资源虚拟化技术引入科技服务领域,构建科技服务资源本体概念和存储模型,实现语义查询映射。

    2 科技资源虚拟化

    资源虚拟化是资源共享和动态分配的关键[7]。科技资源地理分散、结构不一致,要实现跨区域、跨系统、跨结构的资源共享,需要根据各类资源特性构造统一的资源描述模型。将不同系统和不同类型的科技资源抽象为粒度较细的概念及关系,使异构资源描述模型映射为物理或IT服务资源形式,实现跨系统的资源集成。

    2.1 科技资源虚拟化结构

    在科技资源虚拟化过程中,需使用一组属性描述科技资源,标识科技资源的功能属性和非功能属性。异构科技资源有不同的描述属性,需对科技资源的描述属性进行总结,找出资源间的共有属性,并对资源专有属性使用统一的描述方式,以方便系统统一管理与调度服务资源。本文提出的科技资源虚拟化层次结构包括信息服务/物理资源层、虚拟资源层和资源应用层,如图1所示。

    信息服务/物理资源层主要包括科技服务、知识产品、科技资讯、科研仪器和实验器具等各类科技资源,这些分布式科技资源通过互联网、无线通讯技术,以及传感器及GPS等物联网感知技术,以Web接口的形式接入科技服务云平台。

    虚拟资源层则根据科技服务资源描述规范对信息服务/物理资源进行形式化定义,分析科技资源属性信息,统一定义科技服务资源领域本体与语义,构建存储模型和映射规则。通过封装服务资源查询、管理等接口,实现对科技服务资源的访问。

    资源应用层通过调用发布的Web服务接口实现科技服务资源搜索等功能。

    2.2 科技资源表示模型

    科技资源是科技云服务系统中搜索的最小单元,其表示模型是科技资源查找、匹配、推荐的基础,本文中科技资源表示模型定义如下:

    TRes={TR_Id,TR_Property,TR_Interface}

    其中,TR_Id表示所属单位科技资源的唯一标识,在科技服务云平台中,每个服务资源对应一个唯一的由云服务平台创建与维护的通用资源标识符URI。TR_Property表示科技服务资源属性信息,其模型可表示为:TR_Property={BaseInfo,FuncProp,QosProp}。其中,BaseInfo表示科技资源基本信息,包括资源名称、资源URL、资源提供者、提供日期、资源状态等。服务资源包括功能和非功能两方面属性,FuncProp表示科技资源功能属性,包括科技服务、知识产品、科研仪器、科研机构等资源类型;QosProp表示科技资源的非功能质量属性信息,可用于服务资源搜索时的质量因素选择。TR_Interface表示科技资源操作接口,包括资源查询、编辑和管理等。科技服务提供者通过开放接口将科技资源注册到服务系统中,并对科技服务资源进行统一描述,供科技服务用户查询与调用。

    3 科技资源本体构建

    本体定义为“概念化的显式规范”,用可被机器和人类共同理解的模型描述一个特定领域,模型中定义了领域概念与其之间的关系[11]。通过提供一组公共关键字以定义与领域相关概念,关键字描述了每个概念的属性。同时,通过描述概念之间的关系定义现实意义。本体概念可按层次结构进行组织,例如:超类/子类或父/子关系等。

    本体模型的构建不仅可揭示科技信息数据之间的内在联系,明确表达知识含义,还可增强知识内容的共享性和可重用性[12]。本文定义的科技资源领域本体如图2所示,图中包括科技资源功能属性、非功能QoS属性及其之间的层次关系,表1列出了科技资源本体类及说明。

    科技资源按照功能可划分为科技服务、知识产品、科技资讯、科研仪器、实验装置、科研机构、人力资源7大类。其中,科技服务包括科技查新检索、科技咨询、工业设计、技术评估、技术开发、成果转化等;知识产品包括科技论文、专利、技术标准、知识数据库等;科技咨询包括政策法规、科研进展、行业资讯等;科研仪器包括可用设备、仪器、系统平台等;实验器具包括实验试剂、耗材、种质资源等;科研机构包括科技服务机构、大学、企業研究机构、实验室、中试基地、工程研究中心等;人力资源包括科技服务人员、科技活动人员等。

    科技资源按照QoS特征分为业务能力和技术能力两类。其中,业务能力包括用户满意度/声誉、经济因素(免费/固定付费/动态付费)、互操作性(容易/适中/难)等;技术能力包括性能(响应时间/吞吐量/计算精度)、稳定性(带宽/延迟)、健壮性(弱/一般/强)、安全能力(加密/VPN/无)、可用性(修复时间)等。

    构建本体模型主要是设计概念类集合、属性集合和关系集合,概念类层次结构定义了科技资源实体的整体框架。为进一步描述概念类的内部关系,需用数值属性Datatype Property描述类性质,例如定义“专利”的属性,包括专利权人、授权日期、名称、授权专利号等属性信息,并用对象属性Object Property描述概念类之间的语义关系。以科技成果转化业务作为场景,如某科研机构拥有与科研成果A相关的专利,以及与该专利A相关的科研仪器、平台、专家等科技资源可供需求方单位使用。该业务中科技资源功能本体关系如图3所示。其中,实验室机构与专利资源之间具有“拥有版权(hasCopyright)”的关系,实验室机构与专家资源之间具有“工作于(workAt)”的关系,专利与系统平台、科研仪器及科研专家之间具有“相关(relateTo)”关系。该业务的非功能本体关系如图4所示,相关科技资源均具有资源基本信息(hasBaseInfo),实验室机构资源具有QoS声誉属性(hasReputationProp),专利和科研专家资源具有QoS经济因素属性(hasEconomicsProp),系统平台资源具有QoS性能 (hasPerformanceProp)和经济因素属性(hasEconomicsProp),科研仪器具有QoS稳定性属性(hasStabilityProp)。

    4 科技资源存储与访问映射

    4.1 科技资源存储模型

    本体和数据库模型均可表达与存储知识,但两种模型关注点不同[13]。本体通过高层抽象的方式重点解决异质系统交互、知识共享和信息融合等问题,支持概念之间的语义表达,关注数据内涵;数据库重点解决高性能数据存储、便捷查询等数据管理问题,可提供结构化的存储库,关注实例数据存储。考虑两种模型的优势,本文针对科技资源存储,采用两种模型相结合的方式,利用关系型数据库存储科技资源实例以及相关的非功能性数据,通过功能本体和非功能本体提高语义查询效率。

    在关系型数据模型构建过程中,每个科技资源功能本体用4个字段表示,其中主键字段代表功能本体概念的唯一性,其它3个字段分别对应本体概念基本信息、业务质量属性和技术质量属性。例如,科技成果转化业务场景中的数据模型如图5所示,5个功能本体均包括1个主键属性与3个外键属性,3个外键分别对应功能本体实例的基本信息ID、业务质量ID和技术质量ID。数据模型表结构中的主键均按照本体概念名加_ID的规则进行命名。

    4.2 科技资源访问映射

    基于本体的科技资源访问优势是可以进行语义检索,避免仅依靠字面匹配造成的误差,提高资源发现与服务能力[14]。要实现从关系数据库实例数据中进行语义查找,必须建立本体检索到数据库的访问映射。本文建立的映射关系过程如图6所示。

    图6中使用Ontop工具完成从本体检索到数据库实例的映射访问。Ontop是一个虚拟知识图形系统,可将现有关系数据库虚拟化为知识图谱,具有将SPARQL查询转换为SQL查询的能力[15]。实现语义查找的关键是定义科技资源访问映射规则,这些规则将本体概念与数据库表属性建立链接关系,将存储在数据库中的数据转换为RDF三元组集合,每个三元组包括资源URI引用、属性和属性值。例如,概念Reputation的每个本体实例对应两个三元组,资源URI引用表示为“ ”,或者添加前缀“:”表示为“:Reputation_ID_10”,属性表示为“rdf:type”和“:QoSValue”,属性值表示为“:Reputation”和“8”,如表2所示。

    Ontop支持SPARQL语法,可将SPARQL查询映射为关系数据库SQL查询,实现对数据实例的查询。表3列出了科技成果转化业务场景中科技资源访问映射的部分规则,其中“:”代表前缀“<http://www.semanticweb.org/str#”,“{?}”代表实例的主键序号。

    5 测试运行

    本文使用Protégé工具进行科技资源本体建模,并使用微软的关系型数据库SQL Server存储本体实例。Protégé安装Ontop插件后,在工具栏中增加了用于数据源和规则映射配置的Ontop Mappings选项卡与用于查询管理的Ontop SPARQL选项卡。配置数据源连接参数后,通过Mapping manager加入映射规则。从运行结果来看,构建的科技资源本体和存储模型可以有效实现资源的语义查询。

    6 结语

    科技资源集成与共享是国家科技服务发展的基础,本文定義了科技服务资源虚拟池框架,分析了科技服务资源的功能属性和非功能属性,给出了科技服务资源的领域本体和语义定义,研究了科技资源实例存储技术,定义了科技服务资源的统一存储模型和SPARQL语义查询映射规则,为跨区域科技服务共享云平台建设提供了有力支撑。下一步工作将结合业务场景完善领域本体与存储模型,研究映射规则的自动化定义算法,提高工作效率,研究科技服务资源选择与搜索技术,封装资源查询与管理接口,搭建科技服务资源共享云平台。

    参考文献:

    [1] WU H C, HU S Y. An overview of cross-regional collaborative innovation[C]. 2019 3rd International Conference on Advanced Education and Management Science,2019:277-282.

    [2] 宫萍,王理,张辉,等. 基于语义本体的科技资源集成建模研究[J]. 标准科学,2019(3):36-40.

    [3] 王宏起,程淑娥,李玥. 大数据环境下区域科技资源共享平台云服务模式研究[J]. 情报理论与实践,2017,40(3):42-47.

    [4] SAHOO J,MOHAPATRA S,LATH R. Virtualization: a survey on concepts, taxonomy and associated security issues[C]. Second International Conference on Computer & Network Technology,2010:222-226.

    [5] 李宗俊,陈文杰. 区域科技服务资源集成与关联研究[J]. 中国科技资源导刊,2019,51(6):1-5,58.

    [6] LIU X F,SHAHRIAR M R,Al SUNNY S M N,et al. Cyber-physical manufacturing cloud: Architecture, virtualization, communication, and testbed[J]. Journal of Manufacturing Systems,2017,43:352-364.

    [7] LI W,ZHONG Y,WANG X,et al. Resource virtualization and service selection in cloud logistics[J].? Journal of Network and Computer Applications, 2013, 36(6):1696-1704.

    [8] OGAWA K, KANAI K, NAKAMURA K, et al. IoT device virtualization for efficient resource utilization in smart city IoT platform[C]. 2019 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops), 2019: 419-422.

    [9] VICHARE P,NASSEHI A,KUMAR S, et al. A unified manufacturing resource model for representing CNC machining systems[J].? Robotics and Computer-Integrated Manufacturing,2009, 25(6):999-1007.

    [10] 宋佳,高少华,杨杰,等. 科技资源元数据的关联与推荐方法[J]. 中国科技资源导刊,2017,49(5):37-44,103.

    [11] STAAB S, STUDER R. Handbook on ontologies (international handbooks on information systems)[M]. Berlin:Springer-Verlag,2004.

    [12] WONGTHONTHAM P,ABUSALIH B.? Ontology-based approach for semantic data extraction from social big data: state-of-the-art and research directions[J].? Journal of Organizational Computing & Electronic Commerce, 2018,28(4):354-377.

    [13] SIR M, BRADAC Z, FIEDLER P. Ontology versus database[J].? IFAC Papersonline, 2015, 48(4):220-225.

    [14] 宋培彦,陈白雪,贤信. 科技专家信息语义模型构建及实证研究[J]. 情报理论与实践,2017,40(9):123-128.

    [15] Free University of Bozen-Bolzano.Ontop[EB/OL]. https://ontop.inf.unibz.it/.

    (责任编辑:黄 健)

    0 引言

    纯电动汽车的应用可以缓解能源短缺、环境污染等问题,因此各企业越来越重视纯电动汽车生产、技术和销售方面的创新。纯电动汽车销售量也日益增长,根据前瞻产业研究院报告显示,2019年上半年纯电动汽车全球销售量增长了92%,达到76.5万辆,中国市场销售量为43.07万辆,同比增长了111%。由销量数据可以看出,纯电动汽车市场发展前景是可观的。因此,纯电动汽车研发与推广依然是新能源汽车重要的研究方向。近年来在政府与企业的共同努力下,电动汽车在生产成本、行驶里程、资金投入与使用等关键问题上获得了重大突破[1]。对纯电动汽车月度销售量进行预测,能为企业科学制定汽车产量提供依据。

    影响电动汽车销售量的因素众多,且复杂多变,通常具有非线性变化特性,导致传统线性映射模型对纯电动汽车销售量的预测精度较低[1]。因此,很多学者采用基于非线性模型的预测方法。如董丽丽等[2]利用LSTM神经网络对煤矿突水情况进行预测;刘璐等[3]利用SVM对烟草销售量进行预测等。为了实现更好的预测效果,将多种预测方法相结合也成为当前的研究热点[4-5]。如李军怀等[6]提出借助马尔可夫链修正指数平滑的方法预测短时交通流量,以提高预测精度;黄羹墙等[7]首先利用BP神经网络模型对短期电价进行初步预测,再用马尔可夫模型对预测误差进行修正,可提高短期电价预测精度;石萍等[8]考虑电动汽车销量的季节性变化因素,运用组合模型预测新能源电动汽车销售量;周彦福等[9]先利用灰色关联分析8种影响销售量的因素,再构建果蝇算法优化灰色神经网络(FOA-GNN)预测模型进行新能源汽车月度销售量预测,通过对比预测结果,显示该模型具有较高的预测精度。

    在之前的研究中,提取纯电动汽车销售量影响因素时并未考虑消费者预期指数、消费者满意指数、企业家信心指数和煤油电价格指数等因素,本文将这些因素考虑在内,利用BP神经网络预测纯电动汽车销售量,再根据马尔科夫链修正预测结果,以进一步提高预测精度。

    1 BP神经网络与马尔科夫模型

    1.1 BP神经网络模型

    BP神经网络是1986年由以Rumelhart&McCelland为首的科学家小组提出的,是一种利用误差逆传播算法训练的多层前馈网络,因其具有简单易行、计算量小、并行性强等优点,成为目前应用比较广泛的一种神经网络模型[10-11]。BP神经网络由输入层、隐含层和输出层组成(见图1)。在网络训练过程中,通過将输出层与实际输出样本之间的误差经过各隐含层反向传递到输入层,逐层计算各层神经元误差,然后根据误差梯度下降法调节各层权值和阈值,使修改后网络最终输出能接近期望值[12-14]。

    1.1.1 信号前向传播过程

    设网络输入模式为xx1,x2,…,xnT,隐含层有h个单元,其输出为y=(y1,y2,…,yh)T,输出层有m个单元,其输出为z=(z1,z2,…,zm)T,目标输出为t=(t1,t2,…,tm)T,隐含层到输出层的传递函数为f,输出层传递函数为g。计算公式如下:

    x'=x-xminxmax-xmin? ? ? ? ? ? ? ? ? (14)

    3 模型分析与修正结果

    BP神经网络为缩短网络训练时间与提高训练精度,通常选择较少的隐含层结点数[7]。本文选取学习率lr=0.000 1,最大训练次数epochs=10 000,收敛误差goal=1e-3,隐含层神经元结点数为9,训练函数为trainlm。训练网络中将输入数据的70%作为训练集,15%作为测试集,15%用来进行模型预测[15],仿真结果如图2所示。运用BP神经网络对2017-2018年24个月的纯电动汽车销售量进行预测,其实际值与预测值相对误差如表1所示。将相对误差分为6个状态,分别为:E1:-35%~-20%,E2:-20%~-5%,E3:-5%~10%,E4:10%~25%,E5:25%~40%,E6:40%~55%。

    根据相对误差划分状态,利用马尔科夫进行优化,由上述的马尔科夫模型可求得一次状态转移概率为:

    P1=03/401/92/94/91/30001/20011/6010? 01/401/901/9000000000100? ? ? ? ? ? (15)

    将2018年12月作为初始状态α0=010000,根据马尔科夫原理可求得2019年1月状态为α1=α0?P1=1/92/94/91/901/9,则所处状态为E3,对应相对误差为(-5%+10%)/2=2.5%,Markov-BP神经网络模型预测值为6.35×1+2.5%=6.51。同理,利用Markov-BP神经网络模型可得出2019年2月-9月的纯电动汽车预测值,如表2所示。

    从BP神经网络模型与Markov-BP神经网络模型对纯电动汽车销售量预测的相对误差对比可以发现,Markov-BP神经网络模型预测值的相对误差更小,因而提高了预测准确度。

    4 结语

    在提倡绿色发展的大背景下,政府支持纯电动汽车的研发与推广,但现阶段纯电动汽车的销售情况并不乐观。因此,对纯电动汽车销售量进行准确预测,可以减少资源浪费,降低企业成本。本文选取影响纯电动汽车销售量的7个关键因素,利用BP神经网络模型对现有数据进行训练,用测试好的模型预测2019年1月-9月纯电动汽车销售量,再用马尔科夫(Markov)模型修正其預测值。通过对比发现,Markov-BP神经网络模型的预测精度更高,可有效弥补BP神经网络预测的不足。但本文选取的纯电动汽车销售量影响因素不够全面,未结合纯电动汽车价格及相应技术指标进行综合考虑。因此,充分考虑这些影响因素,并找到更合适的纯电动汽车销售量预测模型,是下一步的研究方向。

    参考文献:

    [1] 孙婷婷,沈毅,赵亮. 一种基于BP神经网络的房价预测模型[J]. 电脑知识与技术,2019,15(28):215-218.

    [2] 董丽丽,费城,张翔,等. 基于LSTM神经网络的煤矿突水预测[J]. 煤田地质与勘探,2019,47(2):137-143.

    [3] 刘璐,丁福利,孙立民. 基于SVM的烟草销售量预测[J]. 软件导刊,2016,15(11):134-137.

    [4] 张茜,冯民权. 基于BP神经网络马尔科夫模型的漳泽水库水质预测[J]. 黑龙江大学工程学报,2018,9(2):38-44.

    [5] 王保贤,刘毅. 基于灰色BP神经网络模型的人力资源需求预测方法[J]. 统计与决策,2018,34(16):181-184.

    [6] 李军怀,高瞻,王志晓,等. 基于指数平滑和马尔可夫链的短时交通流量预测[J]. 计算机系统应用,2013,22(12):132-135.

    [7] 黄羹墙,杨俊杰. 基于BP神经网络与马尔可夫链的短期电价预测[J]. 上海电力学院学报,2017,33(1):1-3,10.

    [8] 石萍,黎俊辉,刘洪. 新能源电动车销量预测模型的应用[J]. 辽宁科技大学学报,2016,39(5):395-400.

    [9] 周彦福,王红蕾. 我国新能源汽车月度销售量预测模型研究[J]. 软件导刊,2019,18(8):149-153.

    [10] 陈娟,曹沁愉. 基于马尔科夫链对BP神经网络法残差修正模型的短期风电功率预测[J]. 电力与能源,2017,38(5):567-570.

    [11] 王奕翔,陈济颖,王晟全,等. 基于改进型RF-BP神经网络的房地产价格预测[J]. 工业控制计算机,2019,32(10):122-124.

    [12] 陈广银,蔡灏兢,姜欣. 马尔可夫修正的BP神经网络在PM2.5预测中的应用[J]. 能源环境保护,2017,31(5):8-11.

    [13] WANG H,XU L,WANG X. Outage probability performance prediction for mobile cooperative communication networks based on artificial neural network[J]. Sensors,2019,19(21):4789-4805.