人工智能时代的智能动态财务报告
李红芹 翟军
【摘 要】 数字时代信息发展日新月异,伴随着新证券法的实施,财务报告将呈现出信息量大、结构复杂、重要性强的特点,但是当前的财务报告形式束缚了报告的功能发挥,无法满足人们的信息需求。人工智能的发展将推动财务报告的变革,使得未来的财务报告朝着智能化、动态化方向发展。文章通过借鉴Hoffman的智能数字财务报告思想,提出智能动态财务报告的实现原理和XBRL本体构建思想,阐述了XBRL元—元模型设计和元模型设计,在此基础上以中国通用分类标准CAS为例介绍了符合中国情境的智能动态财务报告构建过程,并探讨了智能动态财务报告的功能,以期推动中国XBRL财务报告的应用。
【关键词】 财务报告; XBRL; 业务规则; 本体
【中图分类号】 F235? 【文献标识码】 A? 【文章编号】 1004-5937(2020)23-0103-06
2020年3月1日新证券法开始实施,企业上市条件由原来的“具有持续盈利能力”改为“具有持续经营能力”,企业的具体经营情况交由投资者自行判断。另外,新证券法强调“强化信息披露是全面推行注册制的重要前提”,要求企业充分披露投资者进行价值判断和投资决策所必需的信息,因此,企业信息是有的,但是需要投资者的专业判断。在此背景下企业财务报告中包含的信息量将不断增大,信息结构日趋复杂,信息的重要性日益增加,如何从中高效提取所需信息支持投资或决策将变得越来越重要。
当前财务报告一般采用电子格式,如DOC、PDF、HTML,在大数据时代,人们对信息的处理大都依赖机器,但是这些财务报告格式都不是机器可读的,机器对企业发布的财务报告信息不理解,无法进行加工处理,限制了人们对信息的深层次分析,也束缚了报告的功能发挥。1998年,美国会计师Charles Hoffman提出了可扩展商业报告语言XBRL,改变了财务报告机器不可读的状况。随后,XBRL在全球不断发展,成为全球财务报告标准。我国引入XBRL已经十多年,但从目前的推广情况来看,XBRL的使用者大多是被强制要求报送XBRL报告的公司,利用XBRL报告进行分析的也只限于懂得XBRL技术的专业分析师,没有实现大规模的推广利用[ 1 ]。其中很大一方面原因在于XBRL对使用者而言过于技术化了;另一方面,虽然XBRL是机器可读的数字财务报告,但是语义缺乏限制了XBRL的功效[ 2 ]。如果使用更高级别的语义模型能够有效地屏蔽技术语法,那么对XBRL使用者来说,复杂的事情将变得更容易。这个过程的实现需要借助人工智能。
人工智能是与人类思维和诸如学习、解决问题、决策等活动相关联的自动化。有学者研究了人工智能在财会领域的应用[ 3 ],指出人工智能應与会计深度融合。人工智能的发展将推动财务报告的变革,使得未来的财务报告朝着智能化、动态化方向发展,帮助人类进行分析决策,同时根据人类需求动态显示报告内容。
一、智能动态财务报告实现原理
2017年,XBRL提出者Charles Hoffman提出了智能数字财务报告。智能动态财务报告的思想由此而来,它是一个理解经济实体、报告事实、财务报告等内容的专家系统。作为人工智能的分支,专家系统使用机器可读的业务规则,在限定的知识领域内重建专家的专门知识和推理能力。
智能动态财务报告的实现涉及技术语法、计算机能够理解的领域语义和业务规则三个要素。技术语法通过采用机器可读标准(如XBRL)实现系统间的信息传递,领域语义表示信息的含义,业务规则是计算机用于交换和处理信息的协议。三者中,业务规则是核心,构建专家系统的关键是将领域中的业务规则(类似于会计准则)转换成机器可读的形式,基于此计算机才能模仿人类,从而实现人工智能。
(一)业务规则
业务规则表达了特定领域事物之间的关系,主要有断言、计算、关系、说明或文档四种类型。断言用于结果验证,如会计恒等式“资产=负债+所有者权益”。计算代表报告编制过程中使用的计算公式,如“货币资金=库存现金+银行存款+其他货币资金”。关系表示事物如何相互联系,如整体与部分的关系。说明或文档表示必须遵守的规章制度,如“现金流量类型必须是经营、筹资或投资”。
当前的财务报告形式,只有XBRL是机器可读的,因此智能动态财务报告的基础是XBRL形式的财务报告。
(二)XBRL财务报告的业务规则类型
XBRL财务报告的组成部分[ 4 ]包括XBRL分类标准和实例文档,分类标准可进一步划分为模式文件和展示链接库、定义链接库、计算链接库、标签链接库、引用链接库、公式链接库。基于上文的业务规则类型,对XBRL财务报告的组成要素进行划分:
(1)断言:XBRL公式链接库和实例文档属于这一类。公式链接库包含一致性断言(已有数据项与计算获得的数据项是否一致)、值断言(计算检验)和存在性断言(存在性检验)。按照断言提供的规则对XBRL实例文档包含的报告事实进行具体检验,为实现智能财务报告的自动检验提供依据。
(2)计算:XBRL计算链接库以及XBRL公式链接库中包含的复杂计算(如乘除关系)属于这一类。
(3)关系:XBRL展示链接库和定义链接库属于这一类。展示链接库定义了报告元素之间的显示层次关系,定义链接库定义了报告元素之间的其他关系如维度定义。
(4)说明或文档:XBRL公式链接库和引用链接库属于这一类。公式链接库包含了规章指示,引用链接库定义了元素的可靠来源。
(三)业务规则的表达
Charles Hoffman等通过对各种语言语义表达和推理能力的综合分析,认为语义Web是一个理想的选择[ 5 ]。语义Web拥有非常灵活和强大的全球标准技术,可以为XBRL添加语义,描述机器可读形式的业务规则,同时还具有推理功能。本体在语义Web中处于核心地位,能够提供机器可理解的精确语义,描述现实世界事物之间的关系。因此,本文利用本体构建智能财务报告的业务规则。
二、智能动态财务报告的XBRL本体构建
(一)XBRL本体研究现状
国内关于XBRL本体方面的研究主要集中在“分类标准”“语义推理”“信息披露质量”“内部控制审计”和“XBRL软件发展”五个方面[ 6 ]。潘定是XBRL语义研究的领军人物,出版了国内第一部研究XBRL元数据语义形式化的专著[ 7 ]。阳震青[ 8 ]提出了基于XBRL本体的网络财务报表分析框架。曾羽琚[ 9 ]指出我国XBRL报告的展示工具不够完善,提出了按需财务报告模式,构建了XBRL报告展示系统,但并未利用本体增加XBRL语义。杜美杰等[ 10 ]从理论角度指出基于语义网的XBRL,计算机可以通过标记读懂报告的含义,并“智能”地对XBRL文档进行校验、查询、分析、挖掘,但未展开实证研究。李永健[ 11 ]构建了XBRL元模型,并把所创建的元模型转换成本体,通过添加规则实现元模型元数据的一致性校验,但未上升到呈报的XBRL文档校验层次。
国外,Bao等[ 12 ]从分类标准模式、链接库和实例文档三个角度分别介绍了其对应的转换规则。Romilla Chowdhuri等[ 13 ]构建了基于本体的XBRL映射和决策框架OFXD,实现了不同分类标准的XBRL文件之间的互操作性问题。Vivian Lee等[ 14 ]指出全面转换XBRL分类标准和实例文档到关联数据格式不是很简单,轻率转换可能导致关系丢失和知识损失,在推理和重建知识时发生困难。
(二)XBRL本体构建思想
现有文献大多基于XBRL技术规范或分类标准构建XBRL本体,但是技术规范或分类标准不是一成不变的,每一个新的版本都意味着一个新的语义词汇表。同时,各国XBRL分类标准是本国会计准则的体现,每个国家的分类标准各不相同,基于分类标准构建得到的本体不具有通用性。因此,为了提高本体的通用性和时效性,XBRL本体构建不能基于分类标准或技术规范,而应该从更高层次上对技术规范进一步进行抽象,元模型可以为此提供解决方案。
元模型的设计思想来源于OMG概念模型。在OMG概念模型中,上一层是下一层的概念模型。而财务报告也是一个层次模型,财务报告包含大量的事实,每个事实又有大量的特征,特征中包含财务报告元素概念。但是,财务报告概念模型不同于普通概念模型,既包括与一般业务报告模型相关的一层(即业务逻辑层),也包括与财务报告中报告的会计项目相关的一层(即XBRL模式层)。
关于利用元模型思想构建XBRL本体方面的研究,Maria Mora-Rodriguez等[ 15 ]提出了一种基于OIM(Open Information Model,XBRL报告内容的语法独立模型)构建本体的方法,根据OIM的四大组件定义了本体类,但是没有将XBRL本体定义抽象出业务逻辑层和模式层这种层次关系,另外,对于报告元素间存在的关系在本体定义中也没有考虑。潘定依据XBRL 2.1技术规范构建了XBRL元模型,但没有关于XBRL模式层的提炼和定义。实际上,XBRL的提出者Charles Hoffman正在构建财务报告本体FRO[ 16 ](Financial Report Ontology),该项目也采用了元模型的思想。因此,本文借鉴Charles Hoffman和Maria Mora-Rodriguez等的XBRL本体构建思想,将XBRL本体设计分为元—元模型设计和元模型设计。在此基础上得到智能动态财务报告的概念模型,如图1所示。
智能动态财务报告概念模型的底层为基于XBRL本体构建的XBRL财务报告,如企业披露的某一期间的资产负债表。XBRL本体是此报告的概念模型,定义了报告的结构和定义,如资产负債表的结构化定义,包括其元素及其结构定义;XBRL元模型是XBRL本体的概念模型即业务逻辑层,用来定义XBRL本体的结构和定义,如财务报告的基本组成部分组件、事实、特征等;XBRL元—元模型是XBRL元模型的概念模型即XBRL模式层,用来定义XBRL元模型的结构和定义,如用来定义组件的网络和表,定义事实和特征的轴、成员、概念等。图1包含了智能动态财务报告与OMG、XBRL概念模型的对应关系。
(三)XBRL本体构建
智能动态财务报告的构建由上而下进行。本部分主要完成XBRL本体构建,即XBRL元—元模型设计和元模型设计。
1.XBRL元—元模型设计
XBRL元—元模型定义了建模元素及其使用规则,为XBRL元模型的构建提供了一种抽象语言。元素模式定义参考Hoffman定义的原型,主要的类有:网络Network、超立方体Hypercube(表Table)、维度Dimension(轴Axis)、成员(Member)、报表项(Line Items)、概念(Concept)和抽象(Abstract)。
网络将财务报告分解成报表、文档或披露,组织智能财务报告的显示顺序。超立方体(表)用来组织轴、成员、报表项、概念和抽象。通常情况下,网络和表是一一对应的。维度(轴)表示事物特征,成员是轴的可能值,报表项包含概念,而概念则以一种能够包含价值的方式描述事实,抽象用来组织信息。
2.XBRL元模型设计
XBRL元模型设计主要完成关系类定义和报告对象的定义,即完成断言、计算和关系类业务规则的定义。关系类定义包括用于定义概念之间的关系、成员之间关系和事实之间关系的链接库类和公式类。报告对象定义包括报告、组件以及描述事实的事实值、特征和说明等。
(1)关系类定义
关系是构成财务报告的各个部分之间的某种相互作用,主要包含两类,一类是财务报告元素之间的关系,另一类是事实之间的关系。财务报告元素之间的关系包括概念之间的关系和成员之间的关系,概念之间的关系包括卷起、前滚、调整、变动、复杂计算和层次,成员之间的关系包括部分集、完全平面集、完全层次集和完全复集。财务报告中还包括一些计算关系,比如用于财务分析的关键财务指标,验证报告数据是否符合要求的验证规则,这些是事实之间的关系。
XBRL2.1技术规范用扩展链接库来表示关系:概念之间的关系用计算链接库和公式链接库,对应计算类业务规则;成员之间的关系用定义链接库表示,对应关系类业务规则;事实之间的关系用公式链接库表示,对应断言类业务规则。
扩展链接库的运行原理为定位器—弧—定位器,包含的基本元素有五类,因此业务规则的定义从链接库类开始,包括定位器类、弧及其子类(如计算弧、定义弧、断言公式弧等)、关系型扩展链接及其子类(计算链接、定义链接、通用链接等)等共计16个类及其属性。
(2)报告对象类定义
报告对象类定义依据XBRL2.1技术规范中定义的实例文档结构以及企业提交的实例文档实例,按照层次性提炼出XBRL报告对象的基本组成部分:财务报告、组件和事实。事实描述需要定义事实值、事实特征以及关于事实的解释说明三个类及其子类,事实特征的子类包括实体、时期,事实值的子类包括非数值型、数值型和计量单位等相关类。报告对象类共计22个类及其属性。
XBRL元模型设计完成后,智能动态财务报告构建的工作进入第三个阶段,依据XBRL元模型进行分类标准的语义形式化,该阶段的实现依赖具体的分类标准,本文以基于中国情境的智能动态财务报告构建过程为例进行介绍。
三、基于中国情境的智能动态财务报告构建过程
依据图1中的智能动态财务报告概念模型,基于中国情境的智能动态财务报告构建过程包括XBRL基本会计概念和实例文档的语义形式化,即依据XBRL本体构建完成分类标准元素、业务规则和实例文档的语义形式化。我国当前有三类XBRL分类标准:CAS(中国通用分类标准)、SSE(上交所分类标准)和SZSE(深交所分类标准)。CAS是中国财政部发布的,具有一定的权威性,因此本文依据CAS 2015版[ 17 ]进行具体的构建。
(一)元素的语义形式化
本阶段工作为根据XBRL元—元模型设计,将CAS分类标准中的财务报告元素定义为元—元模型中的本体类。定义过程依赖于元素类型,《企业会计准则通用分类标准指南》显示2015版通用分类标准共包含5 013个元素,可分为两大类,一类是可赋予事实值的“实元素”,另一类是没有事实值,用来组织元素间关系的“虚元素”。实元素转换为元—元模型中的概念类,虚元素依据具体的类型转换为元—元模型中的具体类即可,如抽象元素转换为抽象类。
下面以中国通用分类标准CAS中的BankBalancesAndCash元素转换为概念类为例:
其中casd代表http://localhost/CASOntology.owl#的前缀,通过采用URI形式表示链接库中的元素,提高元素的可访问性。
(二)业务规则的语义形式化
业务规则的语义形式化即扩展链接库的语义形式化,依据XBRL元模型设计中的关系定义,该过程包括计算链接库、定义链接库和公式链接库的语义形式化。这三类链接库的语义形式化规则相同,利用XBRL元模型設计中的关系型链接库类以及元素语义形式化定义的元素类更改链接库的具体定义。具体需要修改的文件包括CAS分类标准中每项具体会计准则的cal_cas(计算链接库)和def_cas(定义链接库)开头的文件;公式链接库独立于具体的会计准则,共包含for_cas_axis(按轴加总校验)、for_cas_cro(跨期间校验)、for_cas_equ(事实值相等校验)等七类。
(三)实例文档的语义形式化
实例文档的语义形式化需要依据XBRL元模型设计中的报告对象类定义,将其转化为事实表。事实表是一个包含事实值的实例文档。与实例文档不同的是,事实表中每个元素的取值都用概念Concept、实体Entity和时期Period三个轴描述其上下文,概念和实体轴的取值采用的是URI命名方式,可进一步跟踪查询其详细信息。下面以某上市公司2017年XBRL实例文档的一个片段转换为例:
2794122999.84<
/casd:BankBalancesAndCash>
此片段在事实值表中的定义方式为:
xbrlm:Concept
casd:BankBalancesAndCash
xbrlm:Entity
600***(http://www.hisence.com/)
xbrlm:Period
2017-12-31
2794122999.84
iso4217:CNY
2
四、基于中国情境的智能动态财务报告功能
智能动态财务报告的功能体现在两个方面:一是报告质量方面,可以实现报告数据的智能诊断;二是报告应用方面,可以实现报告的动态显示,同时相应的报告数据可以实现与其他数据源的语义聚合,拓展报告的应用范围。
(一)智能诊断
当前财务报告创建时,专业会计人员需要分别输入事实值,元素之间是否满足勾稽关系则需要人工检查,如果检查不认真,可能将违反勾稽关系的报告提交给监管机构,XBRL也不例外。美国众议院监督委员会主席Darrell? lssa指出,截至2015年5月,在检查的10 491家公司提交給SEC(美国证券交易委员会)的128 193份XBRL财务报告中发现了500多万个可能的错误[ 18 ]。常见错误包括报告缺少必需值、项目为负值(应该总是正数)和值不一致的重复项。我国也同样存在XBRL财报信息准确性和可信度不高的问题,XBRL财报存在漏报、错报现象,上交所和深交所在网站上特别声明不能保证XBRL报告数据绝对准确无误,还是要以PDF版本为准。
智能动态财务报告可有效阻止以上情况的发生。以会计恒等式“资产=负债+所有者权益”为例。在智能财务报告业务规则定义阶段,首先将会计恒等式“资产=负债+所有者权益”定义为值断言,嵌入到系统中。在专业会计人员输入资产以及负债和所有者权益的事实值提交报告时,系统自动执行该断言,监控报告编制过程,只有通过检查的报告才能提交给监管机构,同时还可以提供诊断报告。这就是智能财务报告的智能性体现,通过嵌入的业务规则减少专业会计人员工作量,提高生成的财务报告质量。2018年11月XBRL美国地区组织数据质量委员会批准并公布了新的验证规则,以帮助上市公司提高XBRL报告的数据质量[ 19 ]。智能诊断为提高财务报告质量提供了基础,为新证券法的实施提供了技术支持。
(二)报告应用
2018年,财政部发布了《关于基于XBRL(可扩展商业报告语言)的应用案例研究征询意向公告》,计划聘请咨询公司和机构围绕XBRL应用案例开展研究,以便发现企业、政府部门和监管机构在XBRL应用中存在的问题,从而推动XBRL应用。智能动态财务报告可有效提高XBRL财务报告的应用,主要体现在以下方面。
1.动态显示功能
由于XBRL财务报告以XBRL作为开发语言,对于没有XBRL基础的使用者来说,远不如PDF或DOC版本的财务报告直观,也正是鉴于这一点,上交所和深交所试运行之后,取消了XBRL实例文档的下载功能,直接利用图表展示了XBRL财务报告的分析结果,比如报表数据展示或同行业比较,使用者仅能基于交易所网站提供的功能使用XBRL财务报告,无法从个人需求出发深度挖掘和最大化XBRL的功能,限制了XBRL的推广应用。
智能动态财务报告从使用者的视角出发,在构建过程中,通过采用URI命名XBRL本体中的元素,增设网页链接,使得任意一个报告元素都是动态的,都可跟踪,从而打破格式局限,提高XBRL报告的灵活性和使用者的查询效率,改变XBRL报告使用率低的现状。
同时,事实表中每个元素的取值都用概念、实体和时期三个轴描述其上下文,因此在报告显示区域,可设置显示的报告周期和元素。例如,在一家企业多个年份的年报数据中,投资者可以通过报告周期选项选择关注的年份,通过报告元素选项选择关注的报告元素,根据自己的需求动态调整显示信息。
2.语义聚合功能
智能动态财务报告以XBRL本体为基础,因此相应的实例文档可以表示为关联数据,为专业人员进行语义聚合提供基础。语义聚合利用XBRL财务报告关联数据,融合企业其他方面的信息如公司信息、股票、行业信息等,从而让外界更加全面地认识企业。Tong Ruan等[ 20 ]利用中国国家工商行政管理总局的企业信息、中国政府采购网的企业采购信息、中国知识产权局的专利信息、百科全书的企业事件信息以及东方财富网的股票信息,与企业XBRL财务报告进行聚合,构建了企业知识图谱并被中国证券采用。在笔者前期发表的论文中[ 21 ],以证券交易所的公司信息和XBRL报表,中国证券监督管理委员会的行业信息以及同花顺的每日股票报价作为数据源,构建了中国上市公司投资开放数据。基于原型中的关联数据,投资者可以进行公司背景分析、公司间的指标比较、跨数据源的指标比较等。语义聚合拓展了XBRL的应用范围,可以让投资者更加全面地洞悉企业,做出精准投资。
五、研究结论
全球权威IT研究与顾问咨询公司高德纳(Gartner)将XBRL归类为一种转型技术。基于XBRL的智能动态财务报告利用结构化的、机器可读的财务报告和业务规则可轻松避开客观错误,降低业务人员的工作量,提高报告质量,使得专业会计师和财务分析师对报告事实充满信心并专注于机器无法解决的主观领域;同时根据使用者需求动态显示报告内容,为会计师、财务分析师、审计师、监管者及投资者更好地服务;其在语义聚合方面的发展也可迎合大数据的发展趋势,利用多个数据源的聚合结果,更好地服务于各方工作及决策。智能动态财务报告将为推动XBRL的大范围应用及新证券法的实施提供技术支持。
【参考文献】
[1] 陈宋生,罗少东.推进XBRL在企业中应用的几点建议[J].财务与会计,2016(19):59.
[2] CHARLES? ?HOFFMAN, MARIA? ?MORA? ?RODRIGUEZ.Digitizing financial reports-issues and? insights:a viewpoint[J].The International Journal of Digital Accounting Research,2013,13:73-98.
[3] 彭启发,王慧秋,王海兵.会计人工智能存在的风险与对策研究[J].会计之友,2019(5):114-119.
[4] 张天西,李晓荣,吴忠生,等.XBRL财务报告:理论、规范及应用[M].北京:经济科学出版社,2010.
[5] Comprehensive introduction to problem solving logic[EB/OL]. http://xbrlsite.azurewebsites.net/2017/IntelligentDigitalFinancialReporting / Part01_Chapter02.5_ ComprehensiveIntroductionToProblemSolvingLogic.pdf.
[6] LI HONGQIN, ZHAI JUN. Literature review of XBRL semantic research[C].International Conference On Computer Science and Intelligent Communication (CSIC),2015:316-320.
[7] 潘定.XBRL財务报告的元数据语义形式化[M].北京:科学出版社,2015.
[8] 阳震青.XBRL网络财务报表分析系统建模初探[J].财会通讯,2009(12):113-114.
[9] 曾羽琚.基于XBRL的财务会计报告改进研究[D].湖南大学硕士学位论文,2010.
[10] 杜美杰,李吉梅,赵慧周.语义网时代的国际通用商业语言:XBRL[J].财务与会计,2013(6):49-51.
[11] 李永健.XBRL本体构造及推理:以财务信息为例[D].暨南大学硕士学位论文,2014.
[12] BAO J, RONG G, LI X,et al. Representing financial reports on the semantic web: a faithfiil translation from XBRL to OWL[J].Semantic Web Rules,2010, 6403:144-152.
[13] ROMILLA CHOWDHURI, VICTORIA Y, REDMOND R T,et al.Ontology based integration of XBRL filings for financial decision making [J]. Decision Support Systems,2014,68:64-76.
[14] VIVIAN LEE, MASATOMO GOTO, BO HU,et al. Exploiting linked data in financial engineering[J].International Federation for Information Processing,2014,426:116-125.
[15] MARIA MORA-RODRIGUEZ, GHISIAIN AUGUSTE ATEMEZING,CHRIS PREIST.Adopting semantic technologies for effective corporate transparency[C].ESWC 2017,655-670.DOI:10.1007/978- 3-319-58068-5_40.
[16] Financial Report Ontology (FRO) (Working Prototype 2015-01-13)[EB/OL].http://www.xbrlsite.com/ 2015/fro/us-gaap/xbrl/Ontology/index.html.
[17] 中华人民共和国财政部.关于发布2015版企业会计准则通用分类标准的通知[EB/OL].http://kjs.mof.gov.cn/zhengwuxinxi/zhengcefabu/201504/t20150407_ 1213301.html.
[18] JOFFE M D. Open data for financial reporting:costs,benefits,and future [EB/OL]. https://www.datafoundation.org/xbrl-report-2017/.
[19] Approved guidance & validation rules:current approved plugin version:7.0.1(November,2018)[EB/OL].https:// xbrl.us/data-quality/rules-guidance/.
[20] RUAN T, XUE L, WANG H, et al. Building and exploring an enterprise knowledge graph for investment analysis[C]. In:Groth P,et al.(eds)The Semantic Web ISWC 2016. Lecture Notes in Computer Science, vol 9982. Springer,Cham:418-436.
[21] HONGQIN LI, JUN ZHAI. Constructing investment open data of Chinese listed? companies based on linked data[C].dg.o '16,June 08-10,2016,Shanghai,China.DOI:http://dx.doi.org/10.1145/2912160.2912206.