大数据审计：五大趋势与五大挑战

2022.09.29

张敏

【摘要】大数据审计代替传统审计是大势所趋。文章在介绍人工智能和大数据等技术的基础上，提出了大数据审计的五大趋势，即审计智能化、审计平台化、审计信息多维化、从抽样审计向详细审计转变以及审计可视化。同时，还指出了大数据审计面临的五大挑战，即大数据获取成本高、观念与习惯转变困难、人才难得、审计业务的复杂性与大数据审计体系设计的复杂性，研究结论对于大数据审计实践具有一定的借鉴意义。

【关键词】大数据审计; 五大趋势; 五大挑战

【中图分类号】 F239.1? 【文献标识码】 A? 【文章编号】 1004-5937（2020）08-0002-10

会计智能化的趋势已经日渐清晰。无论是实务界、学术界，还是监管机构，关注的重点应该尽快从会计工作是否会智能化、是否会被机器代替，转向如何尽快引进人工智能、大数据等技术推动会计工作、会计教育、会计监管全面向智能化转型。

我们可以在大脑中假想这样三幅图：第一幅图是一条泥泞的土路以及路上的行人;第二幅图是一条高速公路以及路上的行人;第三幅图是一条高速公路以及飞驰的跑车。这三幅图分别代表会计工作的过去、现在和未来。在过去，会计“基础设施”简陋，因而形成了一套人工会计规则。现在，人工智能、大数据等技术蓬勃发展，已经初步具备了会计智能化条件，但我们仍然以人工会计为主。这种状态不具有可持续性，未来一定会形成与技术一致的智能会计体系，即第三幅图。

本文拟从大数据审计角度，尝试分析新技术对审计的影响。具體而言，本文提出大数据审计的五大趋势与五大挑战。

一、大数据审计：五大趋势

审计工作的核心是从纷繁芜杂的结构与非结构化数据中发现风险点进而找出重大错报。随着人工智能、大数据等技术的发展，这一过程正在进行一场深刻的变革，并且呈现出与以往任何形式的审计变革都不一样的特点。具体而言，近期审计工作可能会呈现出如下五大趋势。

（一）审计智能化

技术的进步让审计工作从手工模式向智能化模式转变成为可能，下面结合具体的技术来阐述审计智能化趋势。

1.机器学习

简而言之，机器学习就是要让电脑像人一样学习知识，然后利用学到的知识解决问题。其中最重要的角度之一是基于历史数据训练模型，利用训练好的模型进行预测。机器学习不拘泥于“可解释性”，灵活地选择函数形式进行拟合数据，这使得其预测能力强于传统计量方法[1]。例如，Bao et al.[2]提出了一套利用机器学习技术预测上市公司舞弊概率的方法，发现新模型的预测准确性比传统的逻辑回归模型提高了近5倍②。

另外，用机器学习的方法来尝试预测上市公司的业绩（如图1）。图中a线是上市公司实际的EPS均值，b线是基于机器学习的预测值，c线是分析师的一致性预测值。可以看出，基于机器学习的方法得到的预测值与实际的业绩非常接近，比分析师的一致性预测更准确。

正因为有着传统计量方法所不具备的优势，机器学习技术在审计中具有广阔的应用前景。从短期来看，主要的应用场景包括业务承接、风险评估与控制测试等环节。在业务承接与风险评估环节，可以基于训练好的模型，输入客户公司的数据，自动分析它们的舞弊概率、风险高低、预测的关键财务指标与实际指标之间的差异度等，然后自动判断审计风险的高低，进而确定是否承接该业务;如果承接该业务，则进一步自动分析客户主要的风险点有哪些。在控制测试环节，可以基于以前年度的内控运行数据、训练模型，预测可能的薄弱环节。总之，机器学习技术可以帮助审计师更多地进行非现场审计、智能化审计，在提升效率的同时，大幅度提升审计的质量。

2.自然语言处理

自然语言处理的核心理念是让计算机学习并处理（尤其是人机交互）人类语言，是一个前景广阔的研究与应用领域。目前的技术已经足够用来提升会计审计的智能化水平。在具体应用方面，Chan et al.[3]利用自然语言技术，研究了一个有趣的问题，将人民日报从创刊到2018年的所有文章都“喂给”计算机，然后训练模型，预测每一篇文章成为头版头条的概率，并将预测值与实际值进行比较，构建了一个PCI指数。该指数的值越小，表明从时间序列来看，国家政策比较平稳;反之，则表明国家政策波动较大。如图2所示，以1966—1976年为例，PCI的值较小，说明预测值与实际值比较一致。但是在1970年代末期，PCI的值突然显著上升，表明国家政策正在发生大的变化。例如，以关于真理讨论、经济改革等主题的文章为主。计算机会根据这个指数的变化，提示国家政策正在发生变化。这正如一个人每天阅读人民日报，如果他是有心人并具备很强的逻辑分析能力，就能够根据文章主题的变化，推断国家政策的风向标正在发生变化。不过，机器学习无论是效率还是效果，可能都要优于人类。

自然语言处理技术在审计工作中大有用武之地。它能够帮助审计师自动分析海量的文本，并提炼出大量有价值的信息，这恰恰是传统人工审计的薄弱环节。虽然审计准则要求审计师对被审计单位的各种文件、规章制度、会议记录等文本信息进行分析，从而获取审计证据，但受限于高昂的审计成本，审计师只能分析其中很少一部分，而且效果较差。而计算机可以对这些非结构化数据进行全面高效的分析。例如，通过对报表期间的会议记录等文本信息进行文本分析，判断公司战略、经营管理等方面是否发生了重大变化、如何变化，进而分析可能的审计风险。

在访谈信息处理方面，自然语言处理也很有优势。审计准则要求审计师对相关人员进行访谈，发现进一步审计的线索，尤其是当不同访谈对象针对同一问题给出的回答不一致时，更容易发现线索。然而，人工分析的效率和效果都比较差，会严重影响访谈这一审计程序的应用效果。基于自然语言处理技术，可以实现智能分析。具体步骤如图3所示。首先，通过现场访谈，形成音频文件;其次，自动将语音转为文本信息;再次，利用自然语言处理技术，自动对文本信息进行分析，提取关键信息。例如，通过分析不同访谈对象针对同一问题的回答，分析是否存在矛盾之处;通过分析访谈信息中的高频词，构建词云图（word clouds），判断最关心的事项有哪些等等。总之，采用自然语言处理技术，可以基本实现访谈信息分析的自动化与智能化。

自然语言處理技术也可以用于内控测试。例如，可以自动分析企业内控运行情况是否与内控手册的要求一致。以授权这一重要的控制活动为例，计算机可以自动分析每项业务的授权人是谁，并自动与内控手册中的规定进行比较，看两者是否一致。如果发现不一致，则自动标记为一项内控偏差。

自然语言处理技术也适用于审计质量控制环节。例如，计算机可以自动将工作底稿与审计准则、职业规范等进行对比分析，自动判断审计工作是否符合审计准则和职业规范的要求。比较的点包括重要性水平的确定标准，具体审计项目的抽样比例、审计证据数量、审计程序性质与数量等等。

此外，也可以利用自然语言处理技术自动生成审计报告。计算机会基于工作底稿，自动提取关键信息，基于固定的模板，自动生成审计报告。从技术角度来说，目前已经可以实现。

3.社会网络分析

社会网络分析的核心思想是利用图论等技术研究社会网络关系，即将研究的视角从“点”拓展为“网络”，从而发现更多隐藏在数据背后的信息。以一篇利用网络分析方法研究内控的论文为例[4]，其中一个例子是很多单据无人签字的内控缺陷。根据所有签字人之间的网络关系绘制成网络图，最终形成三个群落（上方、下方、右方），如图4所示，其中每个点表示一个签字人。上、下两个群落通过中间的两个人联系在一起，但右方群落中的三个人是孤立的，从未和其他人员发生关系。可以推测，很可能这三个人之间相互共享ERP的账号和密码。例如按照规定，张三制单，李四复核。但李四觉得太麻烦，干脆将账号和密码告知张三。张三制单之后，再用李四的账号登录系统进行复核，从而导致张三和李四的姓名总是成对出现在单据上。这种网络分析图为审计师进一步搜集证据提供了直接线索。

图5的例子也很直观[5]，这张图展示了某个企业全部供应商的分布图，每个圆点代表一个部门或人员，各联络线分别代表不同的供应商。网络图很直观地展示了供应商信息，可以帮助审计师清晰地辨识可能的异常供货行为。

在审计工作中应用社会网络分析技术具有诸多优势：

其一，社会网络分析技术能够帮助审计师在纷繁芜杂的数据中发现隐藏的信息。审计师在审计过程中需要分析大量结构化和非结构化数据，难点在于如何分析这些数据之间的关系，以及这种关系所揭示的隐含信息。利用网络分析技术，可以将“点数据”变为网状结构，从而快速揭示这些隐含信息，并且实现实时、动态的分析。例如图5所展示的供应商网络关系。

其二，社会网络分析技术能够通过可视化技术直观地展示数据之间的关系。可视化的优点在于将所有结构化和非结构化数据图形化，一目了然，不仅能帮助审计师提高数据分析的效率，更重要的是能够帮助审计师从海量的数据中发现异常，找到进一步审计的线索。

（二）审计平台化

随着技术的进步，审计工作的组织形式将由现在的分部门“单打独斗”模式转变为以平台为中心的模式。

传统的审计组织是一种垂直结构（如图6），团队之间是割裂的，每个团队独自完成从业务承接到出具审计报告的全过程③。这种组织形式存在很多缺陷：其一，无法整合事务所的全部资源，实现资源互补;其二，无法形成专业化运营。现有组织形式下，每个团队都是“全面型”团队，包揽了审计沟通、审计取证、数据分析等所有业务，但在每个方面都无法做到专业化。

实际上，审计业务的核心在于通过数据分析找出风险点和错报，因此数据分析是重中之重。既然如此，审计组织应该以数据分析平台为中心，构建一个敏捷反应组织。例如，阿里巴巴之所以建立数据中台，正是因为它的电商等业务是数据驱动的，离开了全球一流的数据分析系统，就不可能有今天的阿里巴巴。作为新型审计组织核心的数据分析平台也是一种数据中台。

新的审计组织形式如图7所示。居于中心位置的是数据处理中心，它将现场小组、协调小组、质控小组、技术支持小组等业务小组链接起来。数据处理中心就是数据加工厂，它的工作内容包括数据收集、数据分析与结果反馈等方面，并且24小时不间断工作。事务所内部和外部每时每刻都在产生海量数据，包括宏观政策、行业信息、产品信息、客户数据等外部数据;历史业务数据、决策数据、审计师特征信息等内部数据。在现有审计模式下，这些数据中的大多数都未能受到重视。在新的审计组织模式下，数据处理中心是一个专业化中心，能够24小时不间断地收集与分析各方面数据，优化各算法模型。各业务小组可以随时向中心输入数据，提出数据处理要求，中心实时分析，实时输出结果。在这种模式下，各业务小组也变成了专业中心，能够在各自最擅长的领域将工作做到极致。

与传统审计组织形式相比，新审计组织形式具有以下优点：

第一，事务所内部的垂直型组织变成了具有专长的专业小组。各小组最大化发挥专长，整个事务所从一个个割裂的部门的集合变成了众多专长型小组的有机集合体。

第二，事务所由一个反应迟钝的组织变成了一个反应敏捷的组织。各业务小组在强大的数据处理中心的支持下，在各自工作范围内敏捷出击，实时反应。

第三，以数据处理中心为纽带，将整个事务所的资源有机整合起来。每个专长型小组各司其职，发挥专长，互相补充，互相支援，共同对外。

目前，国际“四大”已经在构建数据处理中心，在未来几年内，可能会有越来越多的事务所向这一方向转型。

（三）审计信息多维化

在大数据审计模式下，审计信息将是多维的大数据。传统审计模式下，审计师用于分析的数据主要以结构化数据为主，而且只是可用的结构化数据里很小的一部分。既然要将审计风险尽量降低，那么就不应该只局限于分析有限的信息，只要是有用的信息，都应该纳入数据池，包括内部信息与外部信息、财务信息与非财务信息、结构化信息与非结构化信息等等。在大数据审计模式下，通过引入大数据技术，能够突破传统审计模式下所面临的各种限制，对这些大数据进行整理和分析。

大数据审计中用到的信息除了传统的结构化数据之外，还可以包括文本信息、视频与图像信息、音频信息等多维度信息。

1.文本信息

审计师可用的文本信息包括客户内控文档、生产记录、会议记录、访谈记录、新闻报道等;微博、朋友圈、邮件等社交媒体信息;宏观层面的政策文件、行业信息等等。在传统审计模式下，大量的这类信息都被束之高阁。随着自然语言处理等技术的发展，如今已经有能力对这些信息进行收集和分析。现有不少研究已经证明，文本信息是非常有用的信息，有些时候有用性甚至超过结构化数据。例如，有研究发现，上市公司年报中文本信息的语气以及它们所反映的情绪会显著影响企业风险和股票收益[6-7]。Hoberg et al.（2016）发现，基于上市公司年报中的产品介绍的文本信息提取的行业分类比传统的行业分类更准确。

将文本信息“喂给”计算机后，可以做多维度的分析。如前文提及的让计算机学习并预测人民日报文章的例子，就是基于文本信息进行预测的经典用法，还可以从文本信息中提炼情绪指数。图8是IBM开发的文本信息分析平台，在平台上输入相关文本信息后，将自动输出作者的情绪。例如，将苹果公司年报中“管理层讨论”部分输入平台后，显示该公司管理层的情绪比较负面;当输入ipad这一产品名称时，显示的负面情绪更严重。

上述文本信息分析技术能够广泛应用于审计工作。例如，将公司的相关文本信息输入文本分析平台，可以分析管理层的情绪，判断公司的持续经营能力。如果管理层都比较悲观，说明公司的发展前景确实堪忧。这种分析可以应用于业务承接、风险评估等诸多环节。再比如，可以将文本信息与结构化的财务指标进行比较，看这两类信息是否一致，例如，文本信息显示公司业务增长迅速，但财务指标并未反映这一趋势，则表明公司财务数据或者业务数据可能值得关注。由于文本信息量远大于结构化的财务数据量，将这部分一直被忽略的信息挖掘出来后，能够大大提升审计师发现问题的概率，大幅度降低审计风险。

2.视频与图像信息

这类信息在传统审计模式下基本上未纳入分析范畴，但却非常重要。目前，基于AI的图像识别技术已经有很大进展，实用性很强。例如，Choudhury et al.[8]利用大量图片作为训练集，训练出一套模型，能够非常准确地识别图片中人物的表情。图9是研究者访谈过的一些CEO的照片，作者利用训练好的模型识别他们的表情，准确率非常高。最近，不少高科技养殖公司引入了“猪脸识别”技术，能够自动识别每头猪的身份，并实现实时监控。比如，如果某头猪突然食欲不振，系统会自动识别并发出警报，养殖人员马上进场干预。与传统养殖业相比，这种技术能够大幅度提高预警能力，降低养殖风险。根据报道，京东通过采用这种技术，能将养殖成本降低30%～50%。

在审计过程中，会涉及到很多视频与图像信息，可以将其充分利用。例如，在访谈过程中，可以利用训练好的模型，对访谈对象的表情和肢体语言进行分析，判断他们所提供信息的可靠性。在审计过程中，还可以充分利用客户公司在生产经营场所的视频信息，利用AI进行自动分析，例如可以分析内控的缺陷，根据生产经营视频提取的信息与财务指标进行对比，考察财务业务数据的一致性，利用摄像头进行远程智能存货盘点等等。

3.音频信息

现有研究发现，在资本市场上，音频信息具有信息含量，例如，Campbell et al.[6]发现，上市公司电话会议音频的语气会影响投资者的交易行为。在审计中，音频信息在访谈环节非常有用。前文图3已经展示了如何在审计中利用音频信息。此外，还可以根据对访谈录音进行智能分析，判断访谈对象的性格特征、访谈时的态度等等，据此判断访谈信息的可靠性，或者為进一步采取哪些措施获取审计证据提供线索。

4.其他信息

除了上述信息之外，还有很多其他类型的信息可以用于分析，例如移动互联时代产生的特有信息——定位信息。在使用智能手机时，会用到很多互联网公司或大数据公司的产品或服务，其中很多会留下定位信息。对于这些公司而言，通过分析这些定位信息可以产生很多商业模式，例如，通过定位信息分析某区域的人流量以及他们的特征（例如每个人的来源地），从而帮助商场选址、精准营销等。图10是深圳极光公司利用定位信息绘制的中国人民大学校园实时人流分布图。颜色越深，表明人流越密集。这种图是动态的，反映不同时点人流量的变化。

这种定位信息可以帮助审计师足不出户就能非常准确地核实客户公司的经营情况。以中国资本市场上经典的舞弊案例之一“蓝田舞弊案”为例，蓝田2000年主营业务收入是12.7亿元，每天销售额大概是300万元，大约每天要销售100万斤的水产品。这么多水产品运输大概需要200多辆轻型卡车。据此估算出每天的人流量至少是2 000人。加上公司员工，每天养殖基地进出的人流量至少在2 000人以上。审计师可以利用定位信息，远程判断人流量与公司披露的收入是否配比。

（四）从抽样审计向详细审计转变

随着技术的进步，传统的抽样审计方法可能会慢慢消失，详细审计又重新回归。众所周知，审计产生之初采用的是详细审计方法，但随着企业规模越来越大，业务越来越复杂，详细审计越来越不符合成本效益原则，从而被迫让位于抽样审计。抽样审计虽然能提高审计效率，但它将审计的不确定性带入一个让人日益无法接受的区域，导致审计师时刻面临诉讼风险。

随着人工智能、大数据等技术的日益完善，审计方法重新回归详细审计模式越来越成为可能。从技术角度来说，风险评估、内控测试等环节更容易实现完全智能化，因此它们可能会首先完成智能化转型。而细节测试的智能化转型的难度较大，主要是由于用于准确识别错报的智能模型开发难度较大，涉及到大量的职业判断，因此，细节测试的完全智能化可能尚需时日。

不过，目前的技术可以实现准详细审计，具体步骤如下：首先，让计算机学习规则，例如会计准则、审计准则等。如同战胜围棋冠军李世石的阿尔法狗（AlphaGo），应先让它学会围棋规则。虽然会计和审计规则比围棋规则更复杂，但从技术角度来说是完全可以实现的。其次，让计算机学习过去已经完成的审计业务数据，用机器学习技术，训练错报识别模型。AlphaGo之所以能战胜李世石，是因为它学习了三千万盘棋局，训练出一个高质量模型。通过机器学习，可以让计算机像审计师一样进行职业判断。随着训练集越来越大，训练的模型也越来越精确，计算机会越来越聪明，达到完全代替审计师的程度。最后，利用训练好的模型进行错报识别。与传统的人工审计相比，智能化的详细审计不仅是对所有报表项目进行审计，而且会用到多维度的大数据，审计效率和效果会远远超过审计师。

（五）审计可视化

可视化技术将改变传统审计模式下的数据界面，代之以直观的各种动态图表。目前，已經有很多公司开发出可视化商业智能（BI）产品，商业化应用日益普遍，无论是企业的生产部门、安监部门，还是管理部门，都在大量使用可视化技术。例如仪表盘（驾驶舱）是目前应用很广的可视化产品，它能够直观地反映各环节、各产品、各部门的实时状态，大幅度提升企业决策的效率。

一直以来，审计师在审计过程中面对的大多是数据界面，很难快速找出数据中隐藏的规律和问题，即便是已经加工过的数据。而可视化界面可以直观地将数据形象地展示出来，便于审计师快速分析并得出结论。图11是一个气泡图的例子[9]。横轴是审计客户，纵轴是这些客户公司购买的股票的代码，图中每个点对应的就是每家客户购买的股票，气泡的大小代表投资收益的大小。从图中可以看出，有些公司投资的上市公司数量不多，但每项投资的收益都很可观，因此，应该将这些公司的股票投资业务作为审计重点，看是否存在内幕交易等行为。实际上，在审计的全过程中，都可以基于BI等工具，自动将所有数据以图表形式展现出来。未来的趋势是将AI与BI结合，让可视化技术更加智能。

此外，在审计过程中，可以以仪表盘的形式展示审计项目的实时动态实时展示各小组工作完成情况、所需资源、遇到的困难、发现的问题等等。从项目负责人角度来说，他们可以随时了解项目进展并协调各小组的工作;从项目小组的角度来说，小组之间、小组内部可以实现实时资源共享。在移动互联时代，这些都可以在移动端实现，让审计工作更加便捷高效。

可视化技术不仅适用于审计过程，也适用于审计报告阶段。在出具审计报告之前，审计师要实施分析程序，最后确认审计后的报表是否存在异常。在此阶段，除了可以采用机器学习等方法将审计后的报表与历年报表以及同行业其他公司的报表进行对比分析之外，还可以采用可视化技术，直观而形象地呈现报表项目，便于与历年报表以及同行业其他公司的报表进行比较。关彦庆等[10]仅基于Excel中的Microsoft Research Treemapper控件，就将传统的数字型报表变成了图形报表（如图12所示）。报表中每一个方框的大小代表相应报表项目的金额，颜色代表增长率。与传统报表相比，这种改进后的报表一目了然。当然，基于BI等工具，能够画出更精致更有价值的图形报表。

在审计报告阶段，也可以更多用图表的形式展示审计结果。目前的审计报告属于一维模式，未来的报告应该是多维的，可以用动态图、立体图等形式展示更丰富的细节。

综上所述，可以构建如图13所示的大数据审计框架。大数据审计的核心组织是数据处理中心，它24小时不间断地收集、整理、分析数据，反馈结果。以该中心为平台，首先让计算机储备知识，即让它学习会计、审计等规则以及历史审计数据。学习规则的目的是为了让计算机“懂”会计、审计知识;学习历史审计数据的目的是为了让它成为会计、审计专家，会像人一样进行职业判断。储备了足够的知识和经验之后，计算机就可以开始执行审计业务。在风险评估阶段，可以基于大数据进行自动分析，查找异常。在内控测试阶段，可以基于社会网络分析等技术自动检测各个内控点，自动判断是否存在内控偏差。在细节测试阶段，基于学习的规则和历史审计数据，对所有报表项目进行自动核对，重点根据风险评估和内控测试阶段发现的线索进行强化检测。在审计报告阶段，自动生成审计报告。

二、大数据审计：五大挑战

虽然大数据审计代替传统审计是大势所趋，然而，在目前阶段还存在诸多困难和挑战，需要学术界、实务界和监管层共同合作，逐步加以克服，推动大数据审计的快速落地与迭代。

（一）大数据获取成本高

能否以合适的成本获取所需的数据是进行大数据分析的关键。然而，目前很多数据的获取成本很高。从客户数据来看，在实践中，由于保密性等原因，客户只会提供部分电子数据，而且主要局限于部分财务数据，其中还有不少汇总性数据，不适合进行大数据分析。从外部数据来看，从网络上爬取公开数据也会面临高昂的成本，除了存储成本、人员成本、数据清洗成本等，更大的成本是公开数据的不可获得性或者数据质量较差。例如，要让计算机自动分析客户销售收入的合理性，就需要获取客户具体产品实时的市场价格、市场份额、技术指标等数据，然而，目前网络上关于这方面的数据非常匮乏。而且，随着大数据监管政策趋严，爬取公开数据的成本会越来越高。从事务所内部积累的数据来看，由于我国事务所的信息化水平尚处于一个较低的水平，电子版的历史审计数据积累不够，很难满足机器学习所需要的数据量。

（二）观念与习惯转变困难

人们很难改变已经习惯的生活方式。因此，企业要进行变革，首先就会遇到来自企业内部的阻力。如果是自上而下的变革，往往会面临来自中层和基层员工的阻力。因为从传统审计模式向大数据审计模式转变，需要员工重新学习新知识、抛弃多年来积累的经验和工作方式，必然会引发他们的抵触心理。如果是自下而上的变革，又往往需要说服上层管理者和兄弟部门支持变革，在未取得实质性变革成效之前，要获得他们的支持存在很大难度。从我国目前的审计市场现状来看，事务所之间的竞争还处于争夺客户阶段，尚未进化到技术竞争阶段，事务所在审计模式转变方面的压力较小，主动变革的动力会较弱。

（三）人才难得

大数据审计需要专业的复合型人才，既掌握会计审计知识，又掌握大数据技术。然而，目前这方面的人才极为缺乏。作为人才的主要供给方，目前高校教育普遍还是传统的培养模式，培养的还是传统的会计审计人才。虽然已经有部分高校开始开设智能会计、大数据会计课程或专业，但尚处于起步阶段。很多高校已经意识到向智能会计、大数据会计转型是大势所趋，希望转型，但它们普遍面临的问题是缺教材、缺师资、缺方案。因此，高校还无法向实务界大规模供给大数据审计专业人才。

（四）审计业务的复杂性

随着企业规模越来越大、业务越来越复杂，审计业务也越来越复杂。为了应对这种复杂性，现代审计提供了一套完整而精致的方法体系。然而，即便如此，审计团队花费数月时间，也很难将所有重大错报找出来，更勿论所有错报。作为一种新型审计模式，大数据审计在很多方面优于传统审计，但囿于审计业务自身的复杂性，要很好地实现存在诸多困难，尤其是在细节测试阶段。企业往往会提供多种产品或服务，即使是同一种产品或服务，还存在不同的型号或类型，如果要深入分析每种产品或服务的账务处理是否合理，就需要让计算机学习每种产品的相关知识，而这显然是有难度的。

（五）大数据审计体系设计的复杂性

大数据审计系统应该是一个标准化或者准标准化的系统，能够用于各种审计场景。然而，在实践中，审计师面对的往往并非标准化的场景：不同的企业、不同的产品或服务、不同的商业模式、不同的行业惯例等等。因此，要想设计出一个标准化的审计系统，训练通用性的审计模型，确实存在很大难度。此外，大数据审计模式应该遵循什么思路来构建？是继承传统审计的风险评估、内控测试、细节测试三阶段模式，还是另起炉灶，采用完全不同的模式？目前还没有明确的答案，还需要在审计实务中慢慢摸索出可行的方案。

三、结语

美国科幻小说家凡尔纳曾经说过：“但凡人能想到的事，必定有人能将它实现。”在技术大爆炸的今天，越来越多的颠覆性技术不断涌现，不断重塑企业的商业模式。我们坚信，大数据审计代替传统审计是大势所趋，我们应该主动拥抱这种变革，并努力创新技术，一步步实现它。

世界审计创新的引擎在中国，中国审计创新的关键在产学合作。中国为大数据审计的发展提供了沃土。根据金融数据公司Pitchbook的统计，2018年中国的BAT（百度、阿里巴巴和腾讯）在AI领域共投入了128亿美元，而美国的四大巨头（谷歌、亚马逊、脸书、苹果）合起来才投入17亿美元④。中国在技术方面大规模的投入以及更加宽松的大数据应用环境为大数据审计的发展提供了难得的发展机遇。不过，中国审计要真正引领世界审计的创新，必须加大产学合作力度，单靠实务界或者学术界都很难实现。●

【参考文献】

[1] 陈硕，王宣艺.机器学习在社会科学中的应用：回顾与展望[Z].2018.

[2] BAO YANG，et al.Detecting accounting fraud in publicly traded U.S. firms using a machine learning approach[J/OL].2015.

[3] CHAN J T，et al.Reading China：predicting policy with machine learning[J/OL].2018.

[4] MIEKE JKNS，et al.Does process mining add to internal auditing？An experience report[J].Enterprise Business-Process and Information Systems Modeling，2011（81）：31-45.

[5] LOOKMAN S，et al.A framework for occupational fraud detection by social network analysis[Z].2015.

[6] CAMPBELL J L，et al.Express yourself：Why managers disclosure tone varies across time and what investors learn from it[J/OL].2017.

[7] JIANG F，et al.Manager sentiment and stock returns[J].Journal of Financial Economics，2019，132（1）：126-149.

[8] CHOUDHURY P R，et al.Machine learning approaches to facial and text analysis：Discovering CEO oral communication styles[J].Strategic Management Journal，2019，40（11）：1705-1732.

[9] 陳伟.基于可视化分析技术的大数据审计案例研究[J].中国注册会计师，2019（6）：61-64.

[10] 管彦庆，杨喜梅，博斌.我国企业财务报告的可视化研究——基于上市公司合并资产负债表的Treemaps图形化视角[J].中国注册会计师，2014（9）：74-79.

[11] SUN T S，et al.Applying deep learning to audit procedures：an illustrative framework[J].Accounting Horizons，2019，33（3）：89-109.