最早将数据分析应用于银行业务的是美国一家银行的信用卡部门,他们在20世纪70年代借助计算机技术将统计分析用于申请审核和风险控制。到20世纪80年代末期,数据仓库开始成为向银行决策人员和分析人员提供商业智能的工具。美洲银行是较早进行尝试并获得成功的先行者。20世纪90年代,随着财务分析在银行战略地位的不断演变,财务分析型数据仓库开始被接受和采用。美国的银行业20世纪90年代中后期基本上确立了将集中的数据管理系统,即数据仓库,纳入银行信息系统体系架构中。进入21世纪后,银行与客户之间发生了直接交互的前端业务,银行操作人员越来越需要能收到决策模型和客户轮廓信息,用于帮助他们处理日常工作,这极大地推动了同时分析历史数据和当前数据的复合型需求的发展。
近年来,我国大多数商业银行一般按照“数据集中化、业务综合化、管理扁平化、服务网络化、决策科学化”的理念进行银行信息系统体系建设。一般包含两大数据平台:一个是基于数据大集中的策略,面向金融业务数据处理,构建高效、统一的核心业务处理平台;另一个是面向分析处理,构建完整、一致、反映时间变化的数据仓库。我国银行最早从2000年起着手开展数据仓库的研究,逐步建立了以企业级数据仓库为基础的结构化数据的采集、存储和应用体系,实现了客户信息、账户信息、产品信息、交易信息、管理信息等内容的集中管理,用于海量数据挖掘和分析的数据仓库平台数据总量达几百太字节(TB),包含客户、柜员、各有关机构的交易行为、关联性和交易习惯等大量有价值的信息。依托数据仓库平台,提供通用查询等数据查询类工具、灵活查询等数据探索挖掘类工具和搜索引擎等信息定制类工具,并搭建分析师工作台提供工具集、模型管理的功能,基本满足银行进行用户数据分析与挖掘的需求。