2.大数据的特征
国际数据公司( IDC)从大数据的四大特征来对大数据进行定义,即海量的数据规模( Volume),快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)以及巨大的数据价值( Value)。业界将这四大特征归纳为4个“V”:
1)海量的数据规模( Volume):近些年全球的数据量急剧增加,社交网络、电子商务等将人们带人了一个以PB为单位的新时代。
2)快速的数据流转和动态的数据体系(Velocity):这是大数据区分于传统数据挖掘的最显著特征。信息通常具有时效性,所以必须从各种类型的数据中快速获取信息,才能最大化地挖掘利用信息价值。
3)多样的数据类型(Variety):相比较以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括日志、音频、视频、点击流量、图片、地理位置等,此外,还有一些半结构化数据,如电子邮件、办公处理文档等。
4)巨大的数据价值(Value):从大量的数据中挖掘发现具有高价值的信息,例如天气预测等。这一特征也体现了大数据获取数据价值的本质。
此外,在传统4V特征的基础上提出了大数据体系架构的5V特征。相比较4、,特征,其增加了真实性(Veracity)特征,真实性特性包括了可信性、真伪性、来源和信誉、有效性和可审计性等子特性。