2、更杂
不再是精确性,而是混杂性。
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据分析利用的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。
“大数据”通常用概率说话,而不是板着“确凿无疑”的面孔。整个社会要习惯这种思维需要很长的时间,其中也会出现一些问题。但现在,有必要指出的是,当我们视图扩大数据规模的时候,要学会拥抱混乱。这里谈到数据的混杂,必然会牵扯到混杂数据的存储。传统关系型数据库已经无法满足我们的需求,随之NoSql(非关系型数据)应运而生。随着待处理数据量逐渐增多,大家越来越需要一种在集群环境中易于编程且执行效率高的大数据处理技术,NoSql。NoSql不在局限于传统关系型数据库的条条框框,而只是一个key,一个vlaue,最大的特点准许数据的冗余与混杂。这里不再多探讨非关系型数据库的特点。
【免责声明】本文仅代表作者个人观点,与165平板网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件内容有任何疑问或质疑,请联系本网将迅速给您回应并做处理。