数据集主要特点
-
Volume(大量): 数据量巨大,从TB到PB级别。
-
Velocity(高速): 数据量在持续增加(两位数的年增长率)。
-
Variety(多样): 数据类型复杂,超过80%的数据是非结构化的。
-
Value(低密度高价值): 低成本创造高价值。
其他特征
- 数据来自大量源,需要做相关性分析。
- 需要实时或者准实时的流式采集,有些应用90%写vs.10%读。
- 数据需要长时间存储,非热点数据也会被随机访问。
Volume(大量): 数据量巨大,从TB到PB级别。
Velocity(高速): 数据量在持续增加(两位数的年增长率)。
Variety(多样): 数据类型复杂,超过80%的数据是非结构化的。
Value(低密度高价值): 低成本创造高价值。