乐读文学

如何用数据解决实际问题

乐读文学 > 外国小说 > 如何用数据解决实际问题

“好用”背后的陷阱

书籍名:《如何用数据解决实际问题》    作者:柏木吉基



大多数人可能会回答平均值是处于所有数据正中间的数值,或者是代表值、标准值。但很少有人会考虑“平均值真的能够‘代表’数据,或者真是‘标准’的数值吗?”有人认为平均值代表了数据整体的大小,那么他们的头脑中想象的一定是图  2-7  所示的情况。

图  2-7  是直方图,能够显示位于各个区间(横轴)的数据分别有多少个(纵轴),体现了数据的分布方式。在这个示例中,平均值处于所有数据的正中,与平均值相等或接近的数据最多。其他数据的个数随着对平均值的偏离而逐渐减少。这种情况下,平均值确实可以被称作代表值或标准值。

图  2-7  直方图示例

但是,如果毫不怀疑地把类似图  2-7  的情况作为前提来使用平均值,就有可能陷入意想不到的陷阱。因为未必所有数据都会呈现出同样的分布方式。