从上述定义可以看出,大数据并不仅仅是数据本身,还包括大数据技术以及应用。从数据本身的角度出发,大数据是指大小、形态超出常规数据管理系统采集、存储、管理和分析能力的规模较大的数据集,同时这些数据间存在着直接或间接的关联,利用者通过大数据技术从而实现数据隐藏信息的挖掘和展示。根据来源的不同,大数据大致可分为以下3类:
(1)来源于人:人们在互联网以及移动互联网活动中所产生的文字、图片、视频等数据。
(2)来源于机器:以文件、数据库、多媒体等形式存在的计算机信息系统产生的数据。
(3)来源于物联网智能终端:随着物联网智能终端盼陕速部署,各类物联网智能终端所采集的数据,包括智能摄像头采集的视频、车联网产生的各种实时交通流量、各种可穿戴设备收集人体的各种健康指数监控等。
大数据技术包括数据采集、预处理、存储、处理、分析和可视化,是将数据中的信息挖掘并展示的一系列技术和手段。
大数据应用则是对特定的大数据集,使用大数据技术和手段,实现有效信息的获取过程。大数据技术研究的最终目标就是从规模庞大的数据集中发现新的模式与知识,从而挖掘到数据隐藏的有价值的新信息。