在进行这项研究时,她依靠学生停学的民权数据。
“不幸的是,我认为你并不指望数据是干净的,或者至少你不指望它们是完全干净的,”她说。“但这些数据捕捉到了很多研究人员想要研究的概念,而且在国家层面上没有其他来源,所以人们会使用它们。”
“但你会看到很多疯狂的异常值,”她继续说,“所以你必须做出一些决定,决定如何削减它们。”
数据质量运动(data Quality Campaign)执行副总裁Paige Kowalski说,获得高质量的数据是双向的,该组织倡导收集更有用的数据。她说,像戈登这样的研究人员、老师、家长甚至媒体使用的数据越多,数据就会变得越好、越完善。
“使用驱动质量,”科瓦尔斯基说。“人们对它的关注是不同的,因为我们知道它将会看到曙光,并被用来做决定。”
“我对这种差异的程度和程度感到震惊,”她谈到NPR的分析时说。“但它感觉类似于其他所有收集数据的方式,即你发布数据,并开始询问数据是如何收集的。”
美国教育部民权办公室(Department of Education's Office for Civil Rights)自1968年开始发布数据以来,每两年发布一次。但直到最近,它才以一种相对容易访问的方式,在网上向所有人开放。在此之前,任何想要访问数据的人都需要在提交光盘数据之前填写表格。
科瓦尔斯基解释说:“新的数据收集永远不会产生高质量的数据。”这需要几轮,或许两三轮的收集。我们到达那里的方法之一是发布数据,既返回给提交数据的人,又返回给使用数据的人。这是让人们说‘嘿,我觉得这不对’的最好方式之一。
值得注意的是,数据质量运动并不提倡更多的数据。科瓦尔斯基说,相反,它关注的是生成更好、高质量的数据,以及对这些数据的聪明利用,也就是说,让各机构负责改进对数据的收集和报告。
“用来做决定的数据必须是正确的,必须是可信的,”她说。“对于负责收集这些信息的机构来说,有必要进行尽职调查,制定适当的规程,对这些信息将如何使用进行培训和理解,并进行审计,以确保发布的信息尽可能正确。”
当涉及到公民权利数据时,还不清楚这是什么情况。
教育部发言人莉兹·希尔(Liz Hill)强调,该机构收集的数据是自我报告和自我认证的,调查问卷总是要求地区负责人证明数据是正确的。
“准确、透明的数据对于当地的决策和家长授权至关重要,”她说。她指出,如果数据“看起来异常”,问卷的某些部分将会触发一个提示。
她说:“例如,如果一所学校有100名学生,但有105名学生被停学,这看起来会很奇怪,提交者必须肯定地证实这些数据。”
© 2024. All Rights Reserved. 沪ICP备2023009024号-1