在大数据时代下,要实施有效的精准营销、风险管控和经营分析,银行不仅要知道客户“做了什么”,而且要知悉“客户为什么这么做”,“客户的真实意向是什么”。因此,数据的全面性就显得尤为重要,只有获取全面的数据,才有可能从这些数据中解读出最完整、最准确的信息。传统银行已经实现了大量客户信息和交易数据的积累,可进一步丰富完善新型业务数据、行外征信数据等结构化数据。
数据仓库不仅要具备数据挖掘、分析的能力,而且需要具备将这些数据挖掘、分析结果贯穿到业务流程中实际支持决策的能力。因此,未来的发展上,数据仓库应能够提升数据服务的时效性,可以基于对实时数据和历史数据的分析,跨越核心业务数据平台和数据仓库平台,形成两个平台之间的实时互动,指导业务操作。随着银行自助渠道的发展,非结构化数据也将逐步增大。据统计,至2012年,非结构化数据占有比例将达到互联网整个数据量的80%左右。如果企业结合利用非结构化数据,将能大大扩展企业所掌握的信息和知识,效果可想而知。在这样的发展形势之下,对非结构化数据利用的处理需求也越来越多。对于数据仓库,必须扩展其处理的数据范围,至少可以支持基于结构化和非结构化两类数据融合的数据分析。例如,通过解析从外界获取的资讯信息(一般为非结构化数据),根据资讯信息的关键字分析,结合数据仓库客户特征的分析,将合适的资讯信息推荐给需要的目标客户,为客户提供更多的增值服务。