一种利用Benford定律对上市公司财务报表进行数据质量分析与检查的方法

    黄传连 郭世仁 李秀萍

    

    

    

    摘要:以Benford定律为基础,结合x2检验,分析了5家上市公司2014年度财务报表数据,给出了两者相结合的数据质量分析和检查方法,提出了一种初步研判财务数据质量的简单流程,即先做数字分布情况的简单观察,再做可靠性检验,最后采用逐一剔除法做进一步可靠性检验判断。

    关键词:Benford定律;x2检验;数据质量

    0引言

    近些年来,我国上市公司财务数据出现失真、不准确的情况还是有一些的,财务报表数据造假的案例屡见不鲜,而2014年财政部通过《会计信息检查公告》公布的财务质量检查结果中发现仍有部分上市公司有收入和成本不实,内控不到位等问题,这些问题的发现往往是通过研究上市公司财务报表数据质量得来的。现阶段,有关人士对财务报表数据质量问题也有了更加深入的关注。特别是随着与美国安然公司有关的知名财务报表舞弊案件的爆发,我国证券市场监管者对财务报表的数据质量要求也越来越严格。与此同时,也倡导各会计事务所在发挥自身的专业技能之外,运用更加先进的审计方法和技术手段检查被审计单位的财务报表的数据质量,以得到准确的分析结果,使各利益相关者的权益得到保护。

    本文试图从数据本身的特点出发,基于Benford定律运用统计学的相关理论、知识和方法,从一个全新的角度和流程对上市公司财务报表数据质量进行分析和判断。

    2.2Benford定律的应用

    1972年,Varian提出可以用Benford定律来检测社会科学领域的数据实用性和可靠性。1988年,Benford定律第一次被Carslaw应用到会计领域的数据评估当中,Carslaw通过研究新西兰的220家上市公司的利润表上的净利润这项财务指标数据的第二位数字,发现0出现的概率比理论概率大,然而9出现的概率却小于理论概率,进而证实了所研究的上市公司的管理层存在盈余管理行为这一假设。1994年,Boyle提出,把来自不同地方的财务数据进行加减乘除的运算之后得到的数据仍然符合Benford定律。1996年,Nigrini使用开发的软件对财务数据进行Benford测试,首次将Benford定律的应用领域扩展到舞弊审计,为广大审计人员提供了一种新的审计方法,随后,他还进一步将这种方法应用到会计、税务等领域。2013年,Berdufi D运用Benford定律发现了2009年阿尔巴尼亚议会选举的投票欺诈行为。

    国内学者对Benford定律的研究和应用较国外少,并且应用领域主要集中在会计、审计领域。2003年,丁国勇和冯郁通过对高校财务数据的首位和前两位进行Benford分析之后,认为Benford定律能单纯通过对数字进行分析就找出其中的异常,可以应用于审计工作。

    2006年,曹建新和王忍通过实证研究,首次使用Benford定律分析了我國上市公司年度财务报表的净利润是否存在人为操纵的现象,结果表明,2000至2002年之间存在着比较显著的人为操纵利润的情况,但2001年开始有所改善。

    2010年,金瑛和许涤龙用Benford定律并结合拟合优度检验方法对中国的宏观经济统计数据质量进行分析,研究发现,统计数据符合Benford定律的数字分布规律,准确性较高。

    2012年,万宇飞、李璐和陈曦选取了国泰君安数据库中2011年我国上市公司的财务数据,通过统计分析,并与Benford定律的标准值进行比较,验证了Benford定律在查找企业舞弊迹象的有效性,提出了识别企业舞弊的新方法。

    2.3数据准备

    上市公司的财务数据主要在反映在三大财务报表里面,即利润表、现金流量表和资产负债表。这三大报表需要经过专业的审计人员依据一系列审计法规和标准审计后向市场投资者和社会公众公布。

    本文选取了公布在同花顺官方网站上的2014年我国A股的5家规模、报表项目相当、被标识为ST(即由于财政状况或其他状况出现异常而被特殊处理)的上市公司的财务报表中的利润表、现金流量表和资产负债表数据为样本数据,这5家上市公司分别被标记为A、B、C、D、E公司。为说明问题,本文运用Benford定律只对样本数据的首位数字和第二位数字进行分析。

    3分析过程

    3.1三大报表数字分布的观察

    首先看5家公司各大类报表数据整体上的首位、第二位数字的分布概率以及与Benford定律的数字分布理论值的比较。比如,我们在表1给出的是资产负债表整体数据的首位数字、第二位数字的概率分布情况。

    从表中可以看出,资产负债表整体数据的首位数字的概率分布规律似乎没有很好地符合Benford定律,数字1-6之间的概率分布出现阶段性递减,然后从数字8又开始递减,但在总体上呈现出Benford定律所描述的递减分布情况。同时,数字1出现的概率最大,约占23.243%,符合Benford定律分布概率的特征。第二位数字的概率分布虽然也存在阶段性递增的情况,但总体上也呈现递减的规律。首位数字和第二位数字的概率差异值的绝对值都控制在0至0.1的范围之内。

    限于篇幅,本文只给出如下图1和图2所示的5家公司的利润表和现金流量表的首位数字和第二位数字的分布。

    从中可以看出,利润表整体数据的首位数字的概率分布规律在总体上有呈现出Benford定律所描述的递减分布情况,同时,数字1出现的概率最大,约占32.039%,符合Benford定律分布概率的特征。第二位数字的概率分布总体上也是递减的情况。现金流量表整体数据的首位数字的概率分布规律总体上有呈现出Benford定律所描述的递减分布情况,但是第二位数字分布较为凌乱。

    3.2可靠性检验

    前文的比较结果都是通过直接实验观察统计得到的,本文运用卡方拟合优度检验来衡量上市公司财务报表数据偏离Benford定律的程度。卡方拟合优度检验可用于两个或多个率间的比较、关联度分析等等,在本文中使用的具体公式如下:

    其中,N表示样本数据的总数,θi表示上市公司财务报表数据以i作为首位数字(或第二位数字)的个数占总数个数的比例,f(i)表示Benford定律中数字i作为首位数字(或第二位数字)所占的比例。在进行检验之前,根据卡方拟合优度检验的原则,要对需要检验的问题提出原假设以及备择假设。原假设是指要检验的假设,又称零假设,本文用H0来表示。备择假设是指与原假设H0相对立的假设,又称对立假设,本文用H1来表不。

    从上述公式可以看到,如果θi与f(i)之间不相等,将产生一个正值。经过公式的累加之后,可以得出上市公司2014年财务报表数据的首位数字(或第二位数字)与Benford定律之间具体的偏离程度:x2统计值越小,说明所分析的上市公司财务报表数据的分布与Benford定律偏差越小,即越符合Benford定律,准确度越高。反之,x2统计值越大,说明所分析的数据越不准确,质量也就越差。当x2统计值为0的时候,说明所分析的上市公司财务报表数据的分布与Benford定律完全吻合。由卡方拟合优度检验的临界值表可以知道,当显著性水平为0.05时,自由度为8和自由度为9的临界值分别是15.507和16.919。因此,当财务报表数据的首位数字和第二位数字的X2统计值分别小于15.507和16.919时要接受原假设,即原假设H0是成立的。

    表2和表3分别列出了上市公司年报数据的首位数字和第二位数字进行卡方拟合优度检验的结果。

    表2表明资产负债表数据首位数字的概率分布与Benford定律的首位数字概率分布有显著差异。

    表3说明利润表数据第二位数字出现0-9的概率与Benford定律的第二位数字概率有显著差异。

    综上所述,在显著性水平为0.05的前提下,现金流量表数据无论是首位数字还是第二位数字,其概率分布都能很好地服从Benford定律,因此,可以有较大的把握认为现金流量表数据是准确的、可靠的。但資产负债表数据的首位数字和利润表数据的第二位数字的卡方拟合优度检验都超过临界值,由此可以推断,两者数据的准确性存在问题。

    3.3逐一剔除的可靠性检验

    为了进一步探讨究竟是哪家上市公司的资产负债表数据或利润表数据存在问题,本文采用逐一剔除的方法:逐一剔除某一上市公司资产负债表数据或利润表数据后再对其余上市公司资产负债表数据首位数字、利润表数据第二位数字进行Benford统计,然后用卡方拟合优度检验的x2统计值的变化情况来定位异常的资产负债表或利润表。如果剔除某一上市公司资产负债表数据或利润表数据后,x2统计值明显变小,说明该上市公司的资产负债表数据或利润表数据有很大的可能性存在质量问题。逐一剔除某一公司的资产负债表数据后首位数字的Benford统计和检验结果如表4所示。

    逐一剔除某一公司的利润表数据后第二位数字Benford统计的检验结果表5(仅给出了检验结果)所示。

    通过表4和表5逐一剔除的检验结果可以看出,剔除上市A公司、D公司、E公司后的资产负债表首位数字的x2统计值都有明显变小。同时,剔除上市B公司、D公司、E公司后的利润表第二位数字的x2统计值也有所变小,所以有较大的把握认为A公司的资产负债表数据、B公司的利润表数据、D公司和E公司的资产负债表和利润表数据的可靠性都存在异常。据我们跟踪,D公司到2016年也没有摘除ST标识,而2014年上半年被ST的E公司则在2015年上半年就被摘除ST了。

    4结论

    本文基于Benford定律,选用5家上市公司2014年财务报告中的三大报表数据作为样本进行了整体数据首位数字和第二位数字分布的统计观察和可靠性检验。在得到初步结果基础上,采用逐一剔除的方法做进一步的可靠性检验,得到了更深一步和精确的推断。本文介绍的分析方法和流程简单、实用,得到的结论一方面可以给普通的价值投资者警示尽量少碰通不过检验的公司股票(如D公司),另一方面也给财务数据进一步审计提供了参考(如摘帽比较快的E公司)。另外,本文的分析方法也不局限于上市财务报表数据,对于其他一些需要进行审计或检查的财务、统计类数据质量判断也是有重要价值的。