关注相关系数的平方
接下来,我们来看R 2 。在图 4-2 的例子当中,相关系数是 0.80。其平方为 0.64,与从散点图求出的R 2 =0.640 2 的数值一致。R 2 就是相关系数的平方。因此我们对R 2 也可以采取与相关系数相同的评价标准。
多数情况下,我们将相关系数大于 0.7,或者稍微放宽一些,将相关系数大于 0.5 的情况视为“相关”。0.7 和 0.5 的平方分别为 0.49 和 0.25。大多数情况下,我将 0.7 作为相关系数的标准,将 0.49 作为R 2 的标准,大于这个数值则判断数据相关,可以放心地使用回归方程。对同一数据来说,根据相关系数判断,还是根据R 2 判断,其结果是相同的。
顺便说一下,x 叫作“自变量”或“解释变量”,y 叫作“因变量”或“被解释变量”。不知道这些专用名词也不会影响分析,不过与了解回归分析的人交流时,自然会用到这些词,做些了解也没有坏处。
如果用百分数(%)表示R 2 ,它可以理解为“被解释变量”在多大程度上可以由“解释变量”来说明。就前文这个事例来说,就是在“购买数量”这个变量当中,有 64.02%(=0.640 2)可以通过“公布视频的频率”得到解释。这样可能更便于我们理解R 2 的含义。
那么,刚才得出的回归方程,应该如何解释呢?斜率(3.33)表示,“公布视频的频率”每周增加 1 次,“购买数量”将会增加 3.33 个。比较公布视频的频率增加 1 次的成本和购买数量增加 3.33 个所带来的收益,就可以检验目前公布视频的成本能否带来足够的销售增长。如果公布视频 1 次需要 1 000 日元的成本,而销售增加 3.33 个带来的利润增长为 900 日元的话,我们就不会再进一步增加公布视频的频率。
只靠相关分析的结果无法得到类似的数值关系。通过这种关系可以得知,增加 1 次公布视频的频率,会对目标即购买数量产生多大的影响。如果其他要素与购买数量的相关程度较低,但能给购买数量带来更大影响的话,也可以优先采取那个方面的措施。
另一方面,假设本周销售目标为 400 个,也可以将它代入y ,反向推算公布视频的频率(400=3.33×公布视频的频率+84.9)。计算可知,需要公布视频的频率为 95 次/周。将这种情况反映在散点图上就是图 4-6。
像这样,知道达到目标(例如销售数量 400 个)所需要的输入(例如公布视频的频率)为多少,就可以计算出需要多少资源,或者据此设定行动指标(KPI:重要业绩评价指标),从而制定出更为客观并符合逻辑的计划。
图 4-6 用散点图逆向推算公布视频的频率
后文还会专门介绍具体应用事例,希望这种方法能帮助大家告别只靠“毅力和热情”来制定计划的做法。当然,也可以先设定公布视频的频率,再根据回归方程计算能带来多少购买数量。