浅谈数据挖掘技术在财务舞弊识别中的应用及发展路径

    孙小岚

    摘要:回顾了上市公司产生财务舞弊的原因和识别方法,在此基础上介绍了现阶段常用的大数据挖掘方法以及研究成果,对大数据挖掘的发展前景作了一定的评述。

    关键词:上市公司财务舞弊;数据挖掘;神经网路

    根据中国《独立审计具体准则第8号》,财务舞弊被定义为会计报表不实反映公司真正经济业务的故意行为。财务舞弊由于收益巨大,很多上市公司无视法律,使用编造财务数据,虚增利润等一系列的财务舞弊手段给投资人带来了巨大的损失。从银广厦的利润造假到万福生科的财务造假,各种舞弊手段隐蔽而复杂。目前审计主要依赖人工检查的方式审核财务报表,由于审计人员的经验及主观判断的不同,对于相同的财务报表审计结果也不同,再加上财务造假手段多样,涉及会计科目繁多,人力成本受限,使得审计质量不高。在“互联网+”及大数据背景下,企业可以通过大数据挖掘技术分析公司海量数据和财务舞弊之间的关系,并以此识别公司的财务舞弊行为。

    一、上市公司财务舞弊动因理论

    Bologna和Lindquist提出了会计领域内的冰山理论,他们认为浮在海平面之上的一部分是能被直接观察的企业内部管理方面的问题,比如企业目标、组织架构等;位于海平面之下的部分则是财务造假者蓄意掩饰的内容,这部分内容难以被揭示,包括管理层的主观意愿、个人记录等。

    反舞弊专家Albrecht则提出财务造假三角理论,即产生财务舞弊的诱因有三个,第一是财务舞弊产生的动机,包括不能扭亏为盈公司将终止上市,公司出现财务危机导致融资困难,或者公司现金流面临枯竭等,这一系列的外因是管理层受到的外在压力。而融资压力是我国上市公司面临的最大问题之一,无论公司是需要上市、增发股票还是银行贷款,都需要达到财务上的硬性指标。国内的学者在此理论基础上也提出了财务造假的其他成因,包括为了推进IPO或者增发、防止被ST,和机构联手进行股价操纵等。第二是由于公司内部控制出现缺漏给管理层提供了舞弊的条件。当管理层实施舞弊受到的处罚很轻,公司内部控制存在缺陷,董事会能够隐瞒交易等情况存在时,就具备了财务造假的条件。前两个诱因都满足的时候,决定舞弊发生与否的要素就只剩管理层的道德标准,如果管理层能够自我说服,就会导致舞弊行为的产生,比如:“为了员工的生存”,“维护中小股东的权益”,“帮助公司度过难关”等。Albrecht的三角理论提出后,Bologan提出了“四因子理论”,此理论将财务舞弊的动机归为贪婪和需要;机会是指公司内控机制的不完善带来的条件以及造假行为被发现面临的处罚。

    二、财务舞弊的识别方法

    上市公司财务舞弊的识别分为二个阶段,第一阶段是案例特征总结,研究者对于上市公司公司财务造假的典型案例进行影响因素分析,研究方法主要是定性研究。Beaver在1966年提出了财务预警的概念,然后Albrecht通过问卷调查的方式检验了87个常用的财务指标,并从中筛选出有效识别公司舞弊的指标,构成了“红旗”指标体系。Persons研究发现舞弊公司普遍具有高财务杠杆,低资本周转率的特点。国外学者认为公司治理的质量与财务舞弊发生可行性有密切的关系,开始将董事会特征、股权结构等非财务指标引入财务舞弊识别体系中。Loebbecke建立了公司财务造假识别模型L/W用以分析财务造假的行为特征,提出董事会个人的不良信用记录、违法记录、业绩下滑、控制权寡头等可以作为识别财务舞弊的信号。在接下来的研究中,Loebbecke和Willingham使用财务舞弊公司样本,用卡方检验的方法对L/W进行测试,研究表明该模型有88%的识别率。Bell随后用该模型测试了包含正常公司和财务造假公司的样本,得到了75%的造假识别率。但是这种模型对财务数据和非财务数据的要求苛刻,只适合于能够接触到非公开信息的监管机构和审计人员使用。

    能够识别财务舞弊的非财务指标包括董事会结构、管理层数量等。研究结论包括:审计意见类型可以作为替代审计质量的有效指标,非标准审计意见与财务造假显性相关,提升管理层薪酬和待遇能降低公司财务造假的概率,管理层的独立性和造假行为呈现显著相关性,独立董事占比低,任期短,独立性差与财务造假呈负面相关关系,公司内部审计不能显著降低公司财务舞弊的可能性等。

    第二阶段是用大数据挖掘技术识别财务舞弊。数据挖掘是指从大量无序的数据中找到潜在的商业逻辑,并将结果用可视化的方式向用户进行展示,它包括了统计学中样本检验的过程,也包含了机器学习和训练的过程。数据挖掘作为信息提取和模式识别的手段,可以选择违规案例中的财务和非财务信息构建样本数据和验证集数据,然后用样本数据建立模型,再用验证集测试精确度。数据挖掘典型方法有以下两类。

    第一是统计类方法,分为单变量分析和多元线性方法。传统的回归技术是用统计模型评估应变量和一个或多个自变量之间的关系,主要研究数据系列的趋势特征及数据间的相关关系。这种方法广泛用于解释市场占有率,消费行为偏好、销售趋势预测以及开展有针对性的促销活动等。运用较多的是Logistic回归模型。相比多元线性,逻辑回归有更好的适应性,但逻辑回归也存在变量的多重共线性问题,特别是在财务舞弊的识别领域,由于财务比率之间的勾稽关系,变量相关性高的时候,模型的泛化能力会受到很大影响。

    第二类是在“互联网+”的背景下的大数据挖掘技术的应用。

    分类是根据数据的共同特点按照模式将数据划分为不同类,这个步骤称为用学习训练集创建模型,分类模型的学习阶段中,每个数据元已经分好类别,有明确的类别标记,通过学习得到目标函数, 再利用分类器将其它给定的具有相似特征的数据项映射到预先定义的类别標记中,用以预测数据对象的离散类别,这种学习过程是属于监督式的学习。分类技术广泛地应用在多个领域,比如非财务信息:客户分类,属性和特征分析,满意度分析,购买偏好,趋势预测等。主要的分类方法有决策树、KNN、朴素贝叶斯、支持向量机、随机森林等。在实证研究方面,赵秀云选取了具有财务舞弊特征的18个财务和非财务指标,用决策树构建模型预测发生舞弊的可能性。这些研究多为单因素识别模型,除了传统的回归模型外,随着数据挖掘技术的发展,结合机器学习以及经典算法的应用,可以使用神经网络、聚类等更先进的数据挖掘技术构建财务舞弊模型。

    分类算法的缺陷在于在大数据环境下,数据源多种多样,类别个数和种类无法确定,预处理的过程复杂且代价高昂,聚类提供了相应的解决思路。聚类研究的是在没有训练样本的情况下划分样本,目的是在目标数据库类别未知的情况下分类使得变量在同一聚类之间最小化,不同聚类之间最大化。聚类和分类不同的地方在于分类的类别标记是明确的,学习的类别个数已知,而聚类没有预先定义的类别标记,需要由学习算法自动确认。由于聚类没有明确的定义, 因此存在多种聚类算法和模型,不确定性导致效果难以评估,不重视训练集,通常不涉及预测。常用的聚类算法有K-means均值聚类、DBSCAN、Canopy等。聚类的应用范围包括客户背景分析、市场精分、定义客户信用程度等。

    1958年,Rosenblatt提出了双层神经元组成的单层神经网路“感知器”,“感知器”拥有一个计算层负责输出结果,通过训练得到权值,是首个可以学习的人工神经网络。但是它无法解决异或问题,只能做简单的线性分类任务。“感知器”增加一个计算层变成两层神经网络后,Rumelhar和Hinton于1986年提出的BP算法解决了两层神经网路的复杂计算问题,通过隐藏层对原始数据进行空间变换,使数据从线性不可分变成线性可分,不仅解决异或问题,而且对于非线性可分数据的预测有很高的精确度。

    神经网络的构建首先是选择公司舞弊样本,选择上海和深圳证券交易所以及财政部处罚的违规的公司为样本,其他的筛选条件包括报表类型为年度报告,对比公司选择同行业里资产规模相同,同年份,没有受过监管机构处罚,并剔除被ST过的A股上市公司,剔除金融行业公司。选用的指标分为财务指标和非财务指标,财务指标包括营运能力,偿债能力,风险水平等,非财务指标包括股权结构、治理机制、股权集中度、董事会结构、管理层人员数量等。神经网络的方法对变量之间的多重共线性很敏感,因此对于上述指标进行因子分析简约变量排除多重共线性影响。然后采用不同的神经网络技术构建财务舞弊识别模型,用筛选出来的财务舞弊样本公司作为训练集,对比公司作为测试集进行检验,如果训练结果和测试样本的准确率较高,这个模型就可以作为识别工具。

    Green和Choi于1997年采用随机样本基于神经网路构建了财务舞弊识别模型,随后,国内外学者开始使用不同的挖掘技术进行研究比较。国内研究者张秋三,张磊使用148家上市公司,从盈利能力、偿债能力、成长能力、营运能力、资本结构几个方面筛选出16个财务指标,再结合非财务指标提取的主因子作为输入变量,是否舞弊作为输出变量,用IBM SPSS Modeler构建基于神经网络的财务舞弊识别模型,该模型能够达到70%的正确率。顾宁生选用33个测试样本,其中22个用作训练集,11个用于测试集,用神经网络的识别率能达到86.7%。Kirkos的研究认为应用BP神经网络对于财务报告真假的预测精度能够达到90.3%,高于决策树的73.6%,Alden发现遗传算法相对于Logistic回归模型对财务舞弊有更优异的识别能力,Chi-chen Lin的研究根据129个舞弊样本和447个非舞弊样本比较不同模型识别有效性,认为相比于Logistic模型和决策树,人工神经网络识别效果更优。

    三、未来展望

    将神经网络用于财务舞弊的识别也有不足之处。首先,样本选取的差异性导致模型的实用性得不到保证。研究者无法保证选出的测试样本没有财务舞弊的行为产生,它可能参与财务舞弊,只是还未被发现。另外模型的输入数据都是采用已发布的财务报表上的数据,因此会受到人为因素的影响。其次,不同的研究者对于自变量和因变量的选择逻辑不一,因变量选择0和1衡量公司是否財务造假,无法衡量财务造假的程度。

    近年来,随着文本挖掘方法的兴起,文本挖掘技术也逐渐应用到财务舞弊识别过程中,比如研究财务报表中的表达情绪来区分有舞弊行为的财务报告和真实的财务报告等。随着管理会计信息化体系的完善与推进,未来的大数据挖掘技术将结合文本挖掘,从财务报表、公司公告、自媒体等方面发现更多的财务造假特征。