乐读文学

如何用数据解决实际问题

乐读文学 > 外国小说 > 如何用数据解决实际问题

“变异系数”的魅力

书籍名:《如何用数据解决实际问题》    作者:柏木吉基



还有一种方法是变异系数。使用标准差对波动程度进行相对比较时,必须满足被比较的两个数据大小相当或相同(例如同一家店铺不同月份之间的比较、相同销售额规模的两家店铺之间的比较等)的前提条件。因为一般情况下,如果原始数据值较大,其波动(标准差)也会相对比较大。不消除“数据大小”的差异,就无法进行适当的比较。

说到数据的大小,请各位回忆一下平均值的相关内容。如果能用标准差除以全部数据的平均值,消除数据大小的差异,就可以不必在意原始数据的大小,从数值上用标准差来比较两者的波动程度。标准差除以平均值得到的值叫作变异系数。

顺便提一下,我们无法单独评价变异系数,这个指标只能用来比较不同数据的波动程度。例如,图  2-20  为大规模店铺与小规模店铺的日销售额。只看标准差的话,大规模店铺的波动更大,为  50。

然而考虑到二者之间原本存在销售额的差异,不能这样做单纯比较。计算变异系数,则可以消除销售额规模的差异,从而得知小规模店铺的数据波动更大。也就是说,小规模店的经营风险相对更大。

图  2-20  大规模店铺与小规模店铺的比较

变异系数的魅力在于计算简单,而且与其他统计指标一样,可以只用这一个指标进行客观比较。有些情况下,它还可以弥补直方图的如下缺陷。

例如,记录  A、B、C  三个区域的快递送达天数,制成直方图(图  2-21)。

图  2-21  三个区域送达天数的不同

如果根据这些直方图来讨论哪个区域送达天数的波动更大(注意讨论的不是送达天数),人们的意见可能会出现分歧。事实上,由于区域  C  的数据向左右扩展的范围看似更大,所以很多人会认为该区域的波动较大。我在培训中展示这个直方图时,大家会根据表面现象做出不同的主观判断。这样就无法对讨论的前提形成一致。