研究观察

数据化监管

【小彬说数据化监管】让系统“识数”,才能采集到有用的数据

时间:2020-06-03   来源:北京结算


《在线采集监管数据的几种方式》《根据不同行业的特点选择数据采集的方式》两篇文章里,分析了采集监管数据的技术手段问题。当技术手段问题解决了,接下来就要考虑数据采集规范的问题,也就是需要采集哪些数据、使用什么抽取规则来采集数据的问题。
采集手段的适当性数据采集规范的合理性,共同决定了地方金融监管信息系统的数据采集能力。合理的采集数据规范背后实际是对监管要求的准确把握,对行业业务的深刻理解,因此它应当符合这样几个标准:

数据项是合适的采集的数据是为了满足监管需要的(统计、分析、评估)指标,也即每个数据项都是有意义的。既要尽可能地为每一项监管指标建立采集数据项,也无需采集对监管无用的业务数据。

数据项和数据抽取业务规则是符合行业实际情况的数据项既要抽象出行业的通用概念,又要包容各类特殊情况,达到既统一又多样。另外,还要重视数据抽取的业务规则,例如买卖记录是报送一条还是报送买方一条、卖方一条等等。在设计采集数据体系的时候要考虑各行业的业务流程特点,同时考虑好数据抽取过来后怎么用于数据分析统计,从而设计出合理的数据抽取规则。

数据项之间有关联关系,便于交叉验证

从上述标准可知,建立数据采集规范,必须以满足监管需要为目的,还需要以理解每一项监管指标的数据属性、以及解析对象数据库的数据结构和算法为前提。让监管信息系统“识数”,可谓不易!然而,采集数据的质量是监管信息系统能否真正“有用”的基础,这个难关又必须攻克。
以我们建设地方金融在线监管系统的经验,只要做到以下两点,是有可能建立起合理的数据采集规范的:
首先,要能动地响应监管部门的信息需求。地方金融监管的各类各项指标体系尚无成熟模式,各地监管部门在积极探索中。这就要求监管系统的开发者以建设心态参与到对地方金融监管指标体系的研究探索之中,而不能是你提需求我来开发的被动心态,更不能是照搬金融监管指标体系的应付心态。要积极响应监管部门提出的信息需求,着眼于将这些信息需求转化为指标而提出建设性的专业意见。将监管信息需求转化为可模拟、可测度的定量指标,或者可定类、可定序的定性指标,或者可关联、可定向的图谱结构,也就为数据采集和数据分析提供了明确的目标。
然后,要深透地理解地方金融机构的业务逻辑。数据在线采集实质上是监管系统数据库与监管对象数据库之间的连接和数据传输,而不同监管对象数据库的数据名称、模型、操作规则各不相同。只有对业务有了深刻理解,了解数据的业务含义,才能抽象出通用的数据采集字段,才能知道监管对象数据库的数据模型设计思路和操作规则,从而设计出合理的数据抽取规则。
基于以上两点,整个数据采集规范就是实用、适用、接地气的。有了合理的顶层设计,就能提高整体的工作效率,降低双方的接口开发成本,避免因为顶层设计不合理导致系统性浪费。