在AP统计学中,我们把这张图叫做Scatter plot,图中的那条线我们叫做Linear regression line。
大家可以非常明显地看见,这张图表现出不同的美国大学的Weekday bed time和US news大学排名这两个变量(Variable)之间的关系。
从图上看,入睡时间和大学排名之间还是存在比较强的负相关性(negative association)的。也就是说,如果该大学排名越高,可以预计到该校学生的平均入睡时间越晚。
当然,在途中也出现了一个离群值(outlier)。比较明显的有Air Force Academy和Army/Navy/Coast Guard,这几个学校的特殊性质决定了它必须是outlier。
当然Columbia University也属于一个Outlier,也正好说明了想站在顶端,确实要比别人多花好几倍的努力。
当然,在AP统计学中,单单一个Scatter plot只是表现出了两个变量之间的association,但并不能说两者之间就存在Causation,在这里并没有实际证据证明,大学排名越高就会导致该校学生入睡时间越晚。
再来个另外的例子,一般来说比较发达的城市,汽车保有量比较大,人均寿命也高。相对落后的城市,汽车保有量小,人均寿命也短。在Scatter plot上面,各个城市的汽车保有量和人均寿命这两个变量(Variable)存在正相关性。
但是我们能说汽车保有量增加会导致人均寿命增加吗?
© 2024. All Rights Reserved. 沪ICP备2023009024号-1