“变异系数”的魅力

还有一种方法是变异系数。使用标准差对波动程度进行相对比较时，必须满足被比较的两个数据大小相当或相同（例如同一家店铺不同月份之间的比较、相同销售额规模的两家店铺之间的比较等）的前提条件。因为一般情况下，如果原始数据值较大，其波动（标准差）也会相对比较大。不消除“数据大小”的差异，就无法进行适当的比较。

说到数据的大小,请各位回忆一下平均值的相关内容。如果能用标准差除以全部数据的平均值，消除数据大小的差异，就可以不必在意原始数据的大小，从数值上用标准差来比较两者的波动程度。标准差除以平均值得到的值叫作变异系数。

顺便提一下，我们无法单独评价变异系数，这个指标只能用来比较不同数据的波动程度。例如，图  2-20  为大规模店铺与小规模店铺的日销售额。只看标准差的话，大规模店铺的波动更大，为  50。

然而考虑到二者之间原本存在销售额的差异，不能这样做单纯比较。计算变异系数，则可以消除销售额规模的差异，从而得知小规模店铺的数据波动更大。也就是说，小规模店的经营风险相对更大。

图  2-20  大规模店铺与小规模店铺的比较

变异系数的魅力在于计算简单，而且与其他统计指标一样，可以只用这一个指标进行客观比较。有些情况下，它还可以弥补直方图的如下缺陷。

例如，记录  A、B、C  三个区域的快递送达天数，制成直方图（图  2-21）。

图  2-21  三个区域送达天数的不同

如果根据这些直方图来讨论哪个区域送达天数的波动更大（注意讨论的不是送达天数），人们的意见可能会出现分歧。事实上，由于区域  C  的数据向左右扩展的范围看似更大，所以很多人会认为该区域的波动较大。我在培训中展示这个直方图时，大家会根据表面现象做出不同的主观判断。这样就无法对讨论的前提形成一致。