“变异系数”的魅力
还有一种方法是变异系数。使用标准差对波动程度进行相对比较时,必须满足被比较的两个数据大小相当或相同(例如同一家店铺不同月份之间的比较、相同销售额规模的两家店铺之间的比较等)的前提条件。因为一般情况下,如果原始数据值较大,其波动(标准差)也会相对比较大。不消除“数据大小”的差异,就无法进行适当的比较。
说到数据的大小,请各位回忆一下平均值的相关内容。如果能用标准差除以全部数据的平均值,消除数据大小的差异,就可以不必在意原始数据的大小,从数值上用标准差来比较两者的波动程度。标准差除以平均值得到的值叫作变异系数。
顺便提一下,我们无法单独评价变异系数,这个指标只能用来比较不同数据的波动程度。例如,图 2-20 为大规模店铺与小规模店铺的日销售额。只看标准差的话,大规模店铺的波动更大,为 50。
然而考虑到二者之间原本存在销售额的差异,不能这样做单纯比较。计算变异系数,则可以消除销售额规模的差异,从而得知小规模店铺的数据波动更大。也就是说,小规模店的经营风险相对更大。
图 2-20 大规模店铺与小规模店铺的比较
变异系数的魅力在于计算简单,而且与其他统计指标一样,可以只用这一个指标进行客观比较。有些情况下,它还可以弥补直方图的如下缺陷。
例如,记录 A、B、C 三个区域的快递送达天数,制成直方图(图 2-21)。
图 2-21 三个区域送达天数的不同
如果根据这些直方图来讨论哪个区域送达天数的波动更大(注意讨论的不是送达天数),人们的意见可能会出现分歧。事实上,由于区域 C 的数据向左右扩展的范围看似更大,所以很多人会认为该区域的波动较大。我在培训中展示这个直方图时,大家会根据表面现象做出不同的主观判断。这样就无法对讨论的前提形成一致。