1.1 数据、信息和知识
数据、信息和知识都是社会生产活动中的一种基础性资源,都可以采用数字、文字、符号、图形、声音、影视等多媒体来表示,同时具有客观性、真实性、正确性、价值性、共享性、结构性等特点。三者之间既存在密切的内在联系,又有着显著的区别。
数据、信息和知识是知识工作者对客观事物感知和认识的三个连贯的阶段,主要表现在以下方面:
1.数据的组织阶段
数据是一种将客观事物按照某种测度感知而获取的原始记录。它既可以直接来自测量仪器的实时记录,也可以来自人的认识,但是大量的数据多是借助于数据处理系统自动地从数据源进行采集和组织的,比如银行借助计算机产生的客户数据。数据是最原始的记录,未被加工解释,不能回答特定问题。它仅仅反映客观事物的某种运动状态,除此以外没有其他意义。它与其他数据之间没有建立相互联系,是分散和孤立的。
根据结构的不同,数据可划分为结构化数据和非结构化数据两种。
(1)结构化数据简单来说,就是存储在关系型数据库中的数据,可以用二维逻辑表达实现。结构化的数据可以方便地通过计算机和数据库技术进行管理,信息量值出现在固定的位置,它能够忠实、详细地记录交易活动,是一种显性的表示。
(2)非结构化数据指信息的形式相对不固定,不方便使用数据库二维逻辑表达的数据,包括报表、账单、多媒体视频、网页、电子邮件、语音、图片、图像、办公文档等。银行的非结构数据中超过1/2来源于与客户之间的互动,都是以客户为中心产生的数据。非结构化数据信息量值的位置不固定,价值相对隐匿。