大数据面前,统计学的价值在哪里( 六 )

另外还有一些人 , 虽然他不知道自己后背的编号 , 但是他发现有很多人过来找他 , 所以他很快就意识到 , 自己后背的编号很可能很大 , 但具体多大 , 他并不知道 。 而且要尽可能让两个人组合出来的数字变得很大 。 于是他很快就把眼前这批他能看到数字的人拒绝掉了 , 因为他理所当然地认为接下来肯定还有更大的编号 , 但是他并不知道最大的编号是多少 , 同时他还必须要在5分钟内快速决定跟谁配对 。

这个实验的结果是 , 编号99的男性并没有与编号100的女性配对成功 。 那位编号100的女性 , 找到的是编号八十几的一位男性 。 那些数字在中间的人 , 大体都配对了跟自己差不多的另一个人 。 这个结果 , 很符合中国的一种传统思想 , 也就是门当户对 。

我们现在来看这个实验的结果 , 它基本上跟中国男女婚姻观念的现实比较类似 。 比如说 , 实验者因为自己编号小 , 就让渡自己的奖金给对方甚至于承诺事后请对方吃饭 , 以求得成功配对 , 这个跟现实中“我的个人条件差一些 , 但是我父母同意我们两个结婚之后送给我们一套房子”的承诺是类似的 。 而且我们在生活中也发现 , 一些最优秀的男性女性 , 他们身边不乏追求者 , 但是他们并没有找到自己的“最佳匹配对象” 。

这个数据的收集过程也是非常漂亮的 。

数据并不是越多越好

统计本身是一门收集数据的科学 , 但是数据是不是越多越好呢?很难说 。

历史上有一个非常有名的例子 。 大约500年之前 , 丹麦有一个天文学家叫第谷 , 他从当时的丹麦国王那里要了一笔钱 , 建了一个实验室 。 第谷天天去观察每颗行星的运动轨迹 , 并且每天记录下来 。 于是第谷观察了20年 , 记录了大量的数据 。 不过 , 这个数据太多了 , 第谷花了大量时间、精力来分析这个数据 , 但没有发现任何规律 。


推荐阅读