关于大数据的类型,以下说法错误的是( )
结构化数据通常先有结构再有数据,半结构化数据通常是先有数据再有结构
结构化的数据一般是指可以使用关系型数据库表示和存储,可以用二维表来逻辑表达实现的数据。
半结构化数据完全符合关系型数据库的数据模型结构
非结构化数据包括图片、音频/视频信息等
1.3.2 大数据
(1)结构化数据。结构化的数据一般是指可以使用关系型数据库表示和存储,可以用二维表来逻辑表达实现的数据。结构化数据通常是先有结构再有数据。
(2)半结构化数据。半结构化数据是结构化数据的一种形式,并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素,以及对记录和字段进行分层,数据的结构和内容混在一起,没有明显的区分,因此也被称为自描述的结构。半结构化数据通常是先有数据再有结构。因此,选项C中的说法“半结构化数据完全符合关系型数据库的数据模型结构”是错误的。
(3)非结构化数据。顾名思义,非结构化数据就是没有固定结构的数据,包括所有格式的办公文档、文本、图片、各类报表、图像和音频/视频信息等都属于非结构化数据。对于这类数据,一般直接整体进行存储,而且一般存储为二进制的数据格式。