今天和诸位讨论一下大数据在商业银行选址中落地的问题,文中观点仅代表个人观点。
从2015年起,大数据话题开始在各行各业开始渗透的时候,公司内部就大数据这个话题开始持续的讨论。有意思的是,就在一年前一次与行内领导交流的过程中,我几乎仍无脑地支持对方的“大数据无用论”,在当时的我看来,大数据本身的“噪声”和“精度”的问题在银行网点选址中的应用是极其有限的。而当我今天面对这个话题的时候,大数据“准不准”和“有没有用”已经不是我的关注问题,取而代之的是大数据应该“如何用”。而从整体关注来看,大数据热度也已经逐步让位人工智能这类算法和应用的话题。
图:大数据和人工智能百度搜索指数
显然在讨论大数据如何落地之前,绕不开的一个问题是“大数据”的定义。在此,我认为从实用的角度,多谈无意,而我想要讨论的是在银行布局选址中基于外部形成,区别于传统抽样调查的数据,如手机信令、互联网用户流量、商场消费、房产信息数据等。
不准的数据也能产生价值
当数据与常识发生冲突的时候,我们往往就会产生“数据不准”这个论调,大数据尤甚。大数据不精准是一个客观事实,尽管我们将样本等于总体作为大数据的主要理论特征,但n=all并不是轻易能做到的,主流大数据公司事实上提供的是其用户行为产生的问题,这其中至少包含的两个问题就是,第一,用户的覆盖率和代表性问题,我们并不知道用户规模在实际人群中的比例,并且分布特征能否支持其代表性;第二,用户行为与指标之间的差异,其行为与测量指标之间是否真的有关联,比如刷卡金额能否代表真是消费水平。当然除此之外,还有诸如数据精度等问题。
但不精准的数据是否就没有价值呢。显然,我对这个问题的回答否定的。首先,大数据作为推断的依据,或许在结果上具有一定片面性,但依然是可信的。如当我们细辨这个区域有多少人的时候我们会打上一个问号,但如果我们问这个区域人口相对等级是多大的时候,我们还会有那么大的怀疑吗。其次,大数据不是独立的。在这一个时代,数据应用的一个忌讳就是“一条路走到黑”,我想说的是,大数据与传统数据(调研等)不对立,大数据和大数据之间也不对立,选址的角度是多元的,选址的数据也是多源的。
避免银行选址的内卷陷阱
众所周知的是,商业银行网点选址是一项综合性的工程,外涉及资源、商铺,内涉及成本、战略、定位,其因素相互关联,有时候又相互掣肘。而我看到的是,过去那些完善的、成熟的选址理论中某些因素在逐渐的弱化。在今天,诸位与其把选址布局作为一件复杂的事,不如作为一件专业的事,把关注点聚焦到一些重要的指标,能真正为选址决策带来有效支持的指标。而大数据也在为选址这件事情不断增加新的指标,虽然为选址指标提供了优化的空间,但也要避免陷入不断内卷的陷阱,毕竟选址只是银行发展的其中一小环。
是数据之争还是范式之争
在新数据环境,如何用“大数据”在我看来也是一个颇值得思考的问题。随着大数据被纳入规划选址研究的基础体系,传统分析得以腾笼换鸟,换上新的发动引擎,但新数据能否替代旧数据,能否带来有效提升,在我看来,其中大数据带来的价值是比较有限的。而事实上,新数据的规模得以让机器学习等智能算法焕发生命力,在这个意义上规划选址面临着一种新的范式调整。在这种范式下,面临的两个问题是,特征工程和有效训练集,即如何建立选址分析有效特征供模型分析和什么样的训练集才是合理的。在这两个问题中,我们团队都报以巨大的使命感,也许没有人比我们更懂银行选址的内涵,也许也没有公司以上百个经过分析的城市案例数据库更合适的训练集了。
好了,今天就絮叨这些,之后还会继续分享手机信令数据分析案例。以开放的心态,合适的方法,我相信大数据会带来巨大的惊喜。