5.1 元数据管理概述
1.元数据
人类大脑思维非常神奇,往往可以习惯地利用数据模型将数据和信息加以结构化,还可以利用元数据进行释义并形成数据;同时,通过大脑思维的识别、转化、扩充、统计、分析和挖掘等,可以获取衍生信息,并同样利用数据模型和元数据进行结构化和释义。
元数据最早于1969年由Jack E.Myers提出。长期以来,在银行领域,元数据主要应用在数据仓库。在数据仓库中,元数据是用以描述数据仓库内数据的结构和建立方法的数据。
对于数据仓库这类集成类数据系统来说,存储的表、视图等数据对象数以万计,再加上内部复杂的数据抽取、加载和转换,联机分析处理( On Line Analytical Processing,OLAP)和数据挖掘,以及众多的数据集市,很容易形成“蜘蛛网”现象。而解决“蜘蛛网”问题的关键就在于元数据管理,它可以帮助最终用户理解和使用数据仓库中的数据,也是保证数据质量的关键。同样,它也应用在图书馆日常管理中。图书馆中的书籍多如繁星,要想在浩瀚的书海中快速准确定位到某种想要选择的具体书籍,书签必不可少,而书签就是书籍的元数据。
根据银行数据特点,结合业界理论和实践经验,元数据一般可以分为业务元数据、技术元数据、操作元数据三个类别,内容覆盖结构化数据、半结构化数据以及非结构化数据。