乐读文学

如何用数据解决实际问题

乐读文学 > 外国小说 > 如何用数据解决实际问题

关注相关系数的平方

书籍名:《如何用数据解决实际问题》    作者:柏木吉基



接下来,我们来看R  2  。在图  4-2  的例子当中,相关系数是  0.80。其平方为  0.64,与从散点图求出的R  2  =0.640  2  的数值一致。R  2  就是相关系数的平方。因此我们对R  2  也可以采取与相关系数相同的评价标准。

多数情况下,我们将相关系数大于  0.7,或者稍微放宽一些,将相关系数大于  0.5  的情况视为“相关”。0.7  和  0.5  的平方分别为  0.49  和  0.25。大多数情况下,我将  0.7  作为相关系数的标准,将  0.49  作为R  2  的标准,大于这个数值则判断数据相关,可以放心地使用回归方程。对同一数据来说,根据相关系数判断,还是根据R  2  判断,其结果是相同的。

顺便说一下,x  叫作“自变量”或“解释变量”,y  叫作“因变量”或“被解释变量”。不知道这些专用名词也不会影响分析,不过与了解回归分析的人交流时,自然会用到这些词,做些了解也没有坏处。

如果用百分数(%)表示R  2  ,它可以理解为“被解释变量”在多大程度上可以由“解释变量”来说明。就前文这个事例来说,就是在“购买数量”这个变量当中,有  64.02%(=0.640  2)可以通过“公布视频的频率”得到解释。这样可能更便于我们理解R  2  的含义。

那么,刚才得出的回归方程,应该如何解释呢?斜率(3.33)表示,“公布视频的频率”每周增加  1  次,“购买数量”将会增加  3.33  个。比较公布视频的频率增加  1  次的成本和购买数量增加  3.33  个所带来的收益,就可以检验目前公布视频的成本能否带来足够的销售增长。如果公布视频  1  次需要  1  000  日元的成本,而销售增加  3.33  个带来的利润增长为  900  日元的话,我们就不会再进一步增加公布视频的频率。

只靠相关分析的结果无法得到类似的数值关系。通过这种关系可以得知,增加  1  次公布视频的频率,会对目标即购买数量产生多大的影响。如果其他要素与购买数量的相关程度较低,但能给购买数量带来更大影响的话,也可以优先采取那个方面的措施。

另一方面,假设本周销售目标为  400  个,也可以将它代入y  ,反向推算公布视频的频率(400=3.33×公布视频的频率+84.9)。计算可知,需要公布视频的频率为  95  次/周。将这种情况反映在散点图上就是图  4-6。

像这样,知道达到目标(例如销售数量  400  个)所需要的输入(例如公布视频的频率)为多少,就可以计算出需要多少资源,或者据此设定行动指标(KPI:重要业绩评价指标),从而制定出更为客观并符合逻辑的计划。

图  4-6  用散点图逆向推算公布视频的频率

后文还会专门介绍具体应用事例,希望这种方法能帮助大家告别只靠“毅力和热情”来制定计划的做法。当然,也可以先设定公布视频的频率,再根据回归方程计算能带来多少购买数量。