1.2.1 银行数据的来源及特征
我国商业银行通过广泛的渠道及丰富的产品,在业务开展过程中积累了大量的数据,如客户数据、业务处理数据、内部管理数据、外部数据、系统日志等。特别是近年来,随着社交网络、微博、微信、论坛的兴起,数据来源也已从传统的结构化数据逐渐扩展到以网络日志、社交媒体为代表的半结构化和非结构化数据,银行数据量呈现几何级数的爆发式增长,商业银行逐步进入大数据时代。
大数据时代已经悄然而至,认同这一观点的人越来越多。那么银行的数据到底从哪里来?银行有哪些数据?下面将从技术角度加以解惑,充分介绍它作为新时代变革力量的根本原因。
1.银行的数据是什么
银行业数据原来是金融产品、业务处理、运营管理以及客户服务的副产品,只在后台起支撑作用。随着信息科学技术进步和数据处理能力的提高,大量的数据以结构化或非结构化的形式在IT信息系统中传输、储存、转换、分析和挖掘,并产生能够为特定业务领域服务的信息。
图1-2所示为银行的信息与数据。
随着网络技术的发展,特别是Internet(因特网)和Intranet(内部网)技术的飞速发展,商业银行在使用互联网技术、不断提升客户服务水平和加强风险管理的同时,存款、贷款及汇款(简称存贷汇)等核心业务的结构化数据与日俱增,而电子商务、移动应用、社交网络日益活跃,导致电话语音、网上银行交易记录、电子影像、网点视频、扫描文件、微博、即时通信等非结构化数据(图1-3)、半结构化数据也日趋增大,非结构化数据的增长幅度远远大于结构化数据。