1.语义特征
语义特征是以文字表达的非结构化数 据特有的语义属性。对于书籍、电影类,语义特征一般指作者的创作意图、主题说明等。该属性是非必备属性。
2.基本属性
基本属性是非结构化数据都具有的一般属性,包括名称、类型、创建者、创建时间等。
3.底层特征
底层特征是通过各种专用处理技术(如图像、语音、视频等处理技术)获得的非结构化数据特性,如电话录音的格式、时长要求、比特率等相关技术属性。
4.原始数据
原始数据是非结构化数据的原生态文件。
四面体模型的特点在于语义特征与底层特征进行一体化表达的集成性;图像、文本、视频、音频等多种异构数据表达的统一性;支持语义特征、底层特征动态变化的可扩展性和简单性。基于四面体模型构建的非结构化数据管理模型,将能够实现异构数据进行统一存储与关联操作,从而更好地支持大数据的深度处理。