标题 | 数据包络分析中面板数据的常用处理方式对比研究 |
范文 | 摘要:数据包络分析(DEA)是分析横截面数据的一种方法。其中面板数据的处理主要有三种:直接按面板数据处理、按年分成几个横截面数据处理、所有数据放一个横截面处理。基于DEAP2.1软件以2012—2017年的国有能源上市公司为例,分别用这三种方法进行实证分析并对比结果。结果表明:直接按面板数据处理和按年分成几个横截面处理的实证结果完成相同。而把所有数据放一个横截面处理和面板数据处理的实证结果不具有一致性。 关键词:DEA(数据包络分析);面板数据;对比研究 Abstract: DEA is a method for analyzing cross-sectional data. There are three main types of panel data processing: data processing directly by panel, data processing divided into several cross-sectional sections by year, and all data processing by one cross-sectional section. Based on DEAP2.1 software, this paper takes the state-owned energy listed companies from 2012 to 2017 as an example, and uses these three methods to carry out empirical analysis and compare the results. The results show that the empirical results of direct panel data processing and annual cross-section processing are the same. However, the empirical results of putting all the data into one cross-section processing and panel data processing are not consistent. Keywords: DEA; Panel Data; Comparative Analysis 一、导论 数据包络分析(DEA)是一种分析横截面数据的方法。而绝大部分研究使用DEA模型都需要处理面板数据。目前最常用的处理DEA模型数据的软件是DEAP软件。本文以DEAP2.1软件来处理DEA模型的数据。对于面板数据如何处理,很多文章都没有明确说明。但根据已有的文献,可主要分为三类:一是以Malmquist-DEA为基础,直接按面板数据处理。这种处理方式能测算出决策单元的综合技术效率和纯技术效率值,也能以之为基础通过相除计算出规模效率值。但无法得到规模报酬的变化,也无法得知投入冗余这种可以提高效率的改进方向。有较多研究用了这种方法,如于丽英[1]等运用Malmquist-DEA研究了我国长江经济带的物流效率,并在此基础上提出相应对策。二是按年分成几个横截面数据来处理。这种方式处理,能测算出决策单元的综合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。但无法对各年的值进行比较。如果研究需要进行纵向比较时,往往再用Malmquist-DEA进行测算。有较多研究用了这种方法。如:朱震锋和曹玉昆[2]按这种方式分析了多种经营产业的綜合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。再用Malmquist-DEA进行纵向分析。三是所有数据放一个横截面处理。这种处理方式是使所有的决策单位都在同一个效率边界上,以便不同年度的效率值可以进行比较。亦能测算出决策单元的综合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。也有一些研究用这样的方式处理面板数据,如:刘文君和向冰[3]把所有数据放在一个横截面,求出各钢铁上市公司的超效率技术效率值,然后利用tobit模型来定量分析技术效率的影响因素。本文以2012—2017的国有能源上市公司为例,分别用这三种不同的处理方式进行实证分析。通过实证结果对比,来找出最适合的处理方式。 二、模型、指标与数据 DEA是一种非参数方法,运用线性规划方法来计算效率值。只需要知道投入和产出的值,通过决策单元的生产曲面和最佳前沿面的距离来计算效率值,以此衡量决策单元是否达到最有效。优点在于计算简单,不需要知道生产函数的具体形式,也不需要确定评价指标的权重,具有客观性的特点。DEA模型最初由Charnes,Cooper与Rhodes[4]提出,以规模报酬不变为基础。Banker,Charnes和Cooper[5]在此基础上提出了以规模报酬可变为基础的BCC-DEA模型。该模型放宽了规模报酬不变的假设,使研究的面更广,更贴近于实际 [6] 。 (一) BCC-DEA模型 (二)指标 合理的指标选择是投入-产出评价有效的前提和基础。在产出方面,已有文献多选择主营业收入、营业利润、净利润作为期望产出。本文认为营业利润、净利润不适合作为产出。理由如下:第一,营业利润、净利润都是营业收入剔除营业成本后的净值,DEA是计算投入产出的方法,而不是净产出。第二,营业利润、净利润可能为负值,DEA模型无法运算产出为负值的情况。第三,上市公司营业利润、净利润的人为操作性比较强。在投入方面,年末员工总数作为劳动投入,主营业成本作为中间投入是绝大部分文献的选择。此外,已有文献多偏向于选择固定资产与无形资产的和、固定资产、或总资产等资产作为资本投入。但这些资产每年的消耗量在会计上都计入了主营业成本。故同时选用主营业成本和这类资产作为投入,会造成一定的投入重叠,使效率结果有偏。本文根据已有文献的总结,结合国有能源公司的特殊性,选择主营业收入作为产出指标,主营业成本,年末职工数,管理费用作为投入指标。 (三)数据 本文选择2012—2017年这六年作为研究期。截至2019年,我国在深沪两市的上市的国有能源上市公司剔除报告期内上市和数据缺失的公司之后剩40家。已有文献部分还剔除了ST的上市公司,由于本文选择的产出指标是主营业收入,净利润为负对实证无影响,故不剔除ST公司。本文研究的对象为这40家上市公司。本文的主营业收入、主营业成本、管理费用、年末员工总数的数据来源于csmar数据库。为了剔除通货膨胀的影响,本文通过国家统计局的年度数据,以2012年为基年进行平减。 三、国有能源上市公司投入-产出效率值的实证分析 基于上述模型,使用DEAP2.1软件,以投入为导向,规模报酬可变为基础,分别按面板数据、六个横截面数据、全部数据放一个横截面数据对2012—2017年40家国有能源上市公司投入-产出效率进行测算。 直接使用MALMQUIST-DEA直接做面板数据的实证分析,把结果的“DISTANCES SUMMARY”中的Crste(综合技术效率)的t年的数据和Vrste(纯技术效率)数据导出,再根据公式:Scale(规模效率)=crste/Vrste算出规模效率。把实证结果算出的Mean(均值)、Min(最小值)、Var(方差)及综合技术效率=1的公司数归纳在表1中。 把面板数据按六年分别作为六个横截面数据用普通DEA处理。得到Crste、Vrste和Scale的值。计算均衡、最小值、方差及综合技术效率=1的公司数,归纳至表2中。 把240个数据放一个横截面,用普通DEA处理。得到Crste、Vrste和Scale的值。计算均衡、最小值、方差及综合技术效率=1的公司数,归纳至表3中。 四、 实证分析的结果对比 对比表1和表2,可发现这两个表完全相同。基于此,核对这两种不同方法计算的每一个公司的各年效率值,发现也完全相同。由此可知DEAP2.1软件使用MALMQUIST-DEA做面板数据的实证分析实质是软件把每年的数据当成一个横截面,然后分别做的横截面数据的DEA。因为DEA是一种基于横截面数据的分析方法,所以对面板数据的处理,需分年按横截面数据来做。如果直接按面板数据输入DEAP2.1软件选MALMQUIST-DEA,DEAP2.1软件会自动把你的面板数据分年按横截面来做。 对比表2和表3,可发现这两个表是不同的。把实证结果每年的数据分别对比。从综合技术效率方面看,首先,按年用横截面数据测算的各年综合技术效率值(表2)都高于六年数据全放一个横截面测算出来的综合技术效率值(表3)。其次,表2的综合效率的最小值除2017年等于外,均大于表3测算出来综合效率的最小值。最后,表3各年综合效率的方差除了2017年等于外,均小于表3综合技术效率的方差。此外,综合技术效率等于1的历年公司数,表2均大于表3。说明从综合技术效率方面看,按年用横截面数据比六年数据全放一个横截面测算出的值大,且各年中各个公司的技术效率差异小。从纯技术效率角度看,对比表2和表3,表2纯技术效率值都较高。表2各年纯技术效率最小值都较大,方差除了2015年等于,2017年略小于外,其他年份均较大。从规模效率方面看,对比表2和表3,表2纯技术效率值都较高。表2各年规模效率值最小值除了2012年和2017年略小于表3外,其他年份都较大,方差除了2017年略小于表3外,其他年份均较大。由此可以看出分年用每年横截面数据做实证和所有数据全放一个横截面做实证的结果不同,且不具有趋同性。DEA模型是基于横截面分析的模型,除非有证据可以证明六年的效率边界都不变,不然不能把所有数据放在同一个横截面做实证。 五、结论 1.在投入产出指标选择方面。投入指标选择主营业成本、期末职工人数、管理费用。产出指标选择主营业收入。并以研究期的第一年为基年,剔除通货膨胀影响。 2.直接按面板数据处理和按年分成横截面处理面板数据的实证结果完成相同。按面板数据处理,实质上是DEAP系统自发地按年分成了横截面数据进行处理。而把所有数据放一个横截面处理和面板数据处理的实证结果不具有一致性。因为没法保证每年的效率边界都不变,所以不建议把所有数据放在一个截面来处理面板数据。建议按年分成截面处理。如果要进行纵向比较,建议进一步使用Malmquist指数分解。 [参考文献] [1]于丽英,施明康,李婧.基于DEA-Malmquist指数模型的长江经济带物流效率及因素分解[J].商业经济与管理,2018(4):16-25. [2]朱震锋,曹玉昆.多阶段DEA-Malmquist指数模型下多种经营产业效率测算——基于2007—2015年的经验数据[J].经济问题,2017(3):56-61. [3]刘文君, 向冰. 基于碳排放的中国钢铁上市公司技术效率研究[J]. 中国人口·资源与环境, 2016,26(S1): 10-13. [4]CHARNES A, COOPER W W, RHODES E. Measuring the efficiency of decision making units [J]. European journal of operational research, 1978, 2(6): 429-449. [5]BANKER R D, CHARNES A, COOPER W W. Some models for estimating technical and scale inefficiencies in data envelopment analysis [J]. Management science, 1984, 30(9): 1078-1092. [6]向冰.我国能源上市公司技术效率及其影响因素研究[D]. 南華大学, 2016. [7]范丹, 王维国.中国省际工业全要素能源效率——基于四阶段DEA和Bootstrapped DEA [J]. 系统工程, 2013, (8): 72-80. (责任编辑:顾晓滨 董博雯) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。