互联网哲学家耶夫根尼.莫洛佐夫(Evgeny Morozov)对于现在许多大数据应用背后的理念,他持批评态度。他说,随着算法公式愈来愈多地应用于金融和预防犯罪,应由独立、有资质的人员来掌握和分析它们,以免造成权力的滥用。专栏作家Cashcow则认为,其实,还有很多方面,是大数据并不擅长的。
不擅长社会关系分析
人们的大脑在数学方面比较差,而在社会认知方面则超级强。人们很容易就能够感知到对方的情绪,分辨出不友好的行为,以及根据感情进行价值评估。而计算机主导的数据分析,则擅长于分析社会关系的数量而非质量。社交网络的数据科学家可以分辨出6个你的同事,你一天中有76%的时间会见他们。而却很难发现你一个一年只见两次面的童年伙伴。因此,在需要基于社会关系作出决定时,只依靠计算机而不是依靠你的大脑是愚蠢的。
不擅长上下文情景分析
人们的决定并不是仅仅基于离散的事件的,它往往是基于前后关联的情景的。我们的大脑很擅长这种事情。在讲故事的时候,人们很擅长把不同的原因和情景结合在一起。而数据分析则在这方面表现糟糕,它很难分析清楚就算最简单的小说里的线索和各种前后关系。
产生过多的发现
有一句谚语叫做“在麦堆里面找针尖”。麦穗和针尖看起来差不多,而大数据则让麦穗变得更多了。当我们的数据愈来愈多,我们很容易能够发现很多的统计上重要的关联。而绝大多数的这些关联都是虚假的,会引导我们作出错误的结论。随着数据的增长,这种虚假关联的情况将呈指数级增长。
不擅长处理真正的巨型问题
如果你想看一下哪些邮件对推广活动最有效, 你可以进行随机抽取对比组样本,进行比较。可是,如果要模拟一个衰退期的经济体,那麼我们没办法去找这样的一个对比组。我们经常会看到人们争论甚麼是最好的经济刺激政策,而很少能够看到争论的双方能够用数据分析说服另外一方的。
分析的结论往往基于大众偏好
数据分析可以发现很多人们喜爱的产品,而很多重要的或挣钱的产品一开始往往不为人们所喜爱,因为人们最初不熟悉,而大数据分析往往可能漏掉这样的产品。
原始数据往往会被扭曲
“原始”数据其实也并不原始, 它总是按照某设计者的要求来进行组织的。这样一来,设计者的观点或者价值观总是或多或少会代入这些“原始”数据中去。因此在数据的采集到解释的过程中,都会带有原始数据设计者的意志。
来自36大数据