联盟表只是不加起来


根据两位着名的统计学家的说法,英国学校和卫生当局的成功排名正式的“排名表”包含了一个根本性的缺陷,这使得它们几乎毫无用处这个缺陷的影响是如此之大,以至于被评为表现最佳的机构实际上可能是最差的,反之亦然由于政府作为可靠的绩效数据来源大肆宣传,允许父母和患者作出明智的选择,自1994年推出以来,排行榜一直存在争议大多数批评都集中在他们没有考虑到家庭情况等因素上上学的孩子,或病人到达医院时的情况但根据最新一期“皇家统计学会期刊”发表的详细分析,联盟表忽略了一个更基本的统计效应,即使调整后的表几乎毫无意义在对每个机构进行排名时,排名表只用一个数字来衡量每个机构的表现例如,一组表格基于18岁学校毕业生的A-level考试成绩排名使用这一个数字:它越高,学校“越好”虽然结果表似乎易于理解,但它们隐瞒了这样一个事实,即每个引用数字的可靠性在很大程度上取决于它所基于的样本的大小小样本本质上不如大样本可靠,因为随机效应对整体数字有不成比例的影响例如,一所学校只有几十名学生通过A-levels课程,其排名可能会受到少数几名在考试当天患感冒的人的破坏根据该研究的作者,大多数学校根本没有足够的学生参加考试来抵消小样本效应 “在16至19岁年龄段,全国有少数学校有三四百名学生参加考试伦敦大学教育学院的Harvey Goldstein说,大多数只有50到100个 - 这些都会产生问题 “它们太小而无法提供可靠的排名”为了说明忽略样本量影响的影响,Goldstein在一个地方当局的10所学校中获得了A级绩效数据,并使用标准统计理论来计算“置信区间”,每种数字都有一种错误条结果表明,每所学校的表现的置信区间都很大,以至于它们包含了其他所有学校的表现,因此无法对它们进行任何信心排名教师工会指出,联赛表没有考虑到每所学校学生的能力这导致要求排名包括“增值因素”,显示学校在改善学生表现方面取得的成功然而,Goldstein表明,即使试图弥补这种影响,小样本量的问题仍然使得排名几乎毫无意义从325所学校和大学获取A级数据,并在两年前调整考试成绩 - 一种获取“增值”因素的方法 - 看来唯一明显的区别是前15%的学校和最低15%其他70%的人都没有可靠的排名(见图)该研究的第二作者,剑桥医学研究委员会生物统计学部门的David Spiegelhalter表示,卫生服务排名也受到小样本效应的影响可预防的医疗条件的费率用于衡量卫生当局在实现政府的国民健康倡议下设定的目标方面的成功程度但是许多卫生当局的集水区非常小,以至于置信区间很大,再次排除了可靠排名的希望 “这些排名练习坦白说是浪费时间,”Spiegelhalter告诉“新科学家”杂志这项研究引起了政府官员的不同反应卫生和教育部门的高级统计人员坚持认为,“原始”绩效数据是有价值的,值得发布 “如果公众的信息要产生影响,那么必须简单易懂,”卫生部的一位统计学家说 “我同意应提供有关限制和不确定性的信息,但如何做到这一点,
  • 首页
  • 游艇租赁
  • 电话
  • 关于我们