标题 | 大数据创新应用实践 |
范文 | 曾途 BBD(数联铭品)一直致力于解决中小企业融资难的题问和企业征信建设。首先我们面临的主要问题是大量的中小企业解决了75%的就业人口并创造了60%的GDP,但是很难融资。因为很多领域信息发展不均衡,我们发现中小企业融资不仅是企业面临的难题,甚至是国家和全球面临的难题,我们要去解决此类问题就要把痛点和技术相结合,优先解决信息不对称等问题。 首先我们要通过行为大数据的方式来分析企业的财务信息。我们成立了一个致力于解决中小企业信用评估问题的团队,包括信用风险评估、资本市场评估、资产评价评估等,帮助企业降低信用风险、市场风险和操作风险。 什么是信用风险?第一是征信,第二是信用评价。资产风险是指通过企业风险评估后得出的结果,对企业进行资产定价,这个定价可以得出整个企业未来的收益和发展现状,企业在经营过程当中会出现什么问题。我们提供征信、信用评价和资产定价等整个大数据的支撑服务。利用底层征信平台和征信信息查询企业的信用信息,对诚信进行评价。诚信是指对企业过去行为进行描述,信用是对企业未来违约概率的分析。 BBD一方面做金融风控,一方面开发监管科技。金融风控是通过大数据的方式去评价中小企业行为是否合规以及企业的风险状态,可以帮助银行以此为依据,判断能够给企业提供多少利率的贷款,或提供多少利率的债务融资和股权投资。 在监管方面,我们按照地方金融监管机构的监管办法,监督企业在金融活动当中是否符合监管条例,同时企业如何进行自我约束,做成一个好公司,我们把这方面的数据进行整体融合形成经济指数,提供给监管部门。 目前,BBD大概有300多位研发人员,致力于解决数据痛点。从数据的采集、清洗、分析到数据应用,形成从数据到行为的转化,其业务核心是在数据的清洗、预处理和流失预算等方面进行标注,当标注成功后,围绕数据本体、知识图谱、业务逻辑进行分析,使数據转化成行为过程,形成智能化。 目前,BBD的一体化平台可直接面对多场景、多维度的数据进行调用和综合分析,从而解决中小企业信用风险、市场风险和操作风险的难题。我们的数据平台,无论是专业的API连接,还是爬虫连接,都可以自动完成数据清洗和算法解析,并形成图纸标识库,这是我们在底层应用所做的工作。 在金融数据的处理方面,我们不仅要去处理它详细的清洗信息,还要对它进行解析,做到实时处理,并建立图库。目前我们所建立的图库已覆盖9000万家市场主体信息,包括企业董事、监事和其他高管的调查结果。同时我们在图库中建立了信息自动更新系统,全盘更新只需要一分钟。不管是环形数据、力学布局,还是分层数据、网络化布局,可以根据企业的业务需求,自动化接入不同的数据源形成不同的计算进行知识图谱建模,同时匹配相应的图库工具,然后结合金融的痛点形成圈层,解决整个投融资关系存在的问题。力学布局是解决控制人的问题,对人的关系进行分析时,我们得到了出度、入度、中心度、介度等一系列的物理学指标,这些指标映射成风险。 针对不同指标公司的组合,我们单独建立了计算指标和社群指标,并把每一种指标赋予它金融学含义或金融风险含义,形成一个基于企业的知识图谱。这个知识图谱包括企业的借贷、担保、诉讼、处罚等事件和各个资本维度的事件,并形成从事件、实体、文档到关系的多重属性的四元模型,这个模型的组合构成了金融分析本体论原理。目前,我们的建模已涉及数十亿级的数量处理,以大数据作为征信基础,以征信作为金融信用评估基础,以金融信用评估作为未来授信投资债券基础,为征信提供重组的信用信息,从而解决中小企业信息不对称的问题,和银行一起进行客观授信,而大数据起到的重要作用是把传统的原始数据进行高度抽象之后,形成高纬度、高价值的数据结果信息的典型结构图。 在典型结构图中,如果该企业是制造企业,却从事金融投资方面的业务,通过图形显示,很容易发现企业存在的基本风险,并把这些基本风险进行拆解,形成对网络指标图的基本解读。监管部门或银行不仅了解了企业的股权关系,还了解了企业上下游关系和诚信关系。当对所有关系进行穿透时,可以得到这些结构图中所蕴含的解决方法,在指标结构中,不同的组合影射不同的风险,不同风险可以进行不同权重的组合,并与政府和银行相结合,从而形成一体化的风险解决方案。 面对大数据和金融相结合的痛点,在监管方面的建立也需要一个平台和多个维度的应用,以打击非法集资为例,地方金融监管当局围绕着国家政策和条例,产生出的一系列监管制度是基于大数据风控,我们开发了大数据红警分析平台,帮助政府识别谁有可能成为一个异常的非法集资企业,进行因果和关联分析找出企业的问题点。 (根据演讲内容整理,未经本人审核) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。