我为什么反对在属性数据MSA中用Kappa分析(上)

1,340次阅读
没有评论

共计 1839 个字符,预计需要花费 5 分钟才能阅读完成。

这可能是一篇会引起很多争议的文章,在写完初稿后搁置了大半年的时间,现在略作修改分两次发完,希望能够引起大家的讨论。

熟悉我的人都知道,在MSA中,我明确反对两个东西。

一个是ndc,因为这只是%P/Tv的另一个解释,但却派生出独立的判断标准,使得两个指标之间产生了矛盾,使人无所适从。在《六西格玛管理统计指南》第3版(以下简称指南三)p.405-407有详细阐述,在此不再赘述。

另一个就是属性数据MSA中的Kappa。

一致率、误判率、漏判率这些简单明了的指标足以让我们对测量系统做出恰当的判断,为什么还要画蛇添足地加上一个Kappa呢?很多年来我从来不讲Kappa,在蓝皮书里也只是简单提了一下,并没有做详细的阐述。但这也没有什么用,Kappa分析仍大行其道,又像ndc一样,成为了一种教条。

虽然明确反对使用Kappa分析,但说实话,我自己也信心不足,毕竟对此没有多深入的了解。为此我做了一些功课,也有了一些心得。在此提出来与各位探讨,欢迎拍砖。

我们先看看针对属性数据的一致性标准。

我为什么反对在属性数据MSA中用Kappa分析(上)

这样的标准表述比较清晰,很容易理解,也比较容易得出结论。

再看看Kappa的标准,大于0.9可接受,介于0.7~0.9可勉强接受,小于0.7不合格。但0.7或0.9的实际意义是什么,与一致性有什么关系,却没有说清楚。在实际应用中,当Kappa的结论与一致性的结论矛盾时,往往让人无所适从。如下面这个案例:

 

我为什么反对在属性数据MSA中用Kappa分析(上)

 

从分析结果上中,评估一致性以及与标准的一致性均只有76%,但Kappa值却有0.75和0.87。根据上述标准判断,一个是不合格,一个是可以让步接受,那应该怎么下结论呢?如果判定不合格,但Kappa却显示可以用,尤其是后一个,都接近0.9了;如果判定可接受,但明明一致性不好啊。

类似的不协调也出现在%P/Tv和ndc之间,这里不再赘述。

为什么会出现这种结果呢?本文试图从Kappa分析的原理来做一探究。

Kappa分析有两种。

一种是Cohen’s Kappa,只能用于分析对同一组对象两次评价的一致性,如一个人先后两次评价的一致性、一次评价与标准的一致性、两个人对同一组对象评价的一致性等。具体原理参见拙作《列联表篇之二:四格表的分析》。

另一种就是大家熟悉的Fleiss’ Kappa,可以用于对同一组对象的多次评价的一致性分析,目前流行的属性数据MSA就是采用这种分析。具体原理参见拙作《列联表篇之十:属性相同双向有序表的Kappa分析》。

首先用Cohen’s Kappa做一个热身。

在四川大学王军2006年的硕士论文《Kappa系数在一致性评价中的应用研究》中,总结了三种反例。其中之一如下例:

我为什么反对在属性数据MSA中用Kappa分析(上)

这个案例中,一致率达到了0.704,但算出的Kappa值却只有0.006,这明显不符合常理。更进一步看下一个例子:

我为什么反对在属性数据MSA中用Kappa分析(上)

这两个案例的一致率都是0.8,但Kappa值却相差很多。

问题出在四格表中左上角a和右下角d取值不平衡上。可以想见,a和d相差越大,Kappa值越小。

我为什么反对在属性数据MSA中用Kappa分析(上)

我们可以做一个模拟,来看看Kappa值是如果随a、d的取值变化的。

为了方便使用Cohen’sKappa,假设在属性一致性分析时,选择了50个样品,由一个人重复测量2次。构建的四格表如下:

我为什么反对在属性数据MSA中用Kappa分析(上)

为了分析方便,我们固定取b和c为1,这样可以计算出一致率P0为0.96,这应该是很高的一致率了。a取值从24逐渐减到0,同时d从24逐渐加到48,我们可以看看Kappa值呈现怎样的变化。

我为什么反对在属性数据MSA中用Kappa分析(上)

可以看出,当a减少到13时,Kappa值降低到0.9以下,当a继续减少时,Kappa值会快速下降,这时就会出现判据不一致的问题。

如果将一致率降低到0.9,则Kappa的变化曲线是这样的。

我为什么反对在属性数据MSA中用Kappa分析(上)

此时Kappa最大只有0.8,也就是说,即使一致率达到了90%,因为Kappa均在0.8以下,因此也不能得出测量系统合格的结论,又产生了判断不一致的情况。

由上面的初步分析可以看出,Kappa值的大小依赖于样本的结构。如果MSA样本中合格与不合格品数量差异很大,则会得到小的Kappa值。如果你想得到比较Kappa值与一致率大致相当的结论,建议尽可能保持合格/不合格样本量的平衡。

在不了解样本结构时直接根据Kappa下结论是危险的。即使Kappa值为1,如果样本全部是非常容易判断的产品组成的,那么这个结论也是值得怀疑的。反过来说,即使Kappa值不高,但样本构成中包含大量难判断的产品,结论也不是不可接受,需要进一步分析检验员判断错误的实际情况后作出恰当的结论。

来源:张老师漫谈六西格玛

正文完
 0
评论(没有评论)

汽车质量管理笔记

文章搜索
猜您喜欢
激光拼焊板基础知识大全

激光拼焊板基础知识大全

激光拼焊是一种新兴的焊接技术,可以将不同材质,不同厚度的材料焊接在一起,可以有效的减重并增加安全性,降低成本。
科尔尼战略采购七步法:优化采购流程,提升企业核心竞争力的实战手册

科尔尼战略采购七步法:优化采购流程,提升企业核心竞争力的实战手册

科尔尼七步战略采购法是一种系统化的采购管理方法,旨在通过严谨的流程和科学的工具,帮助企业优化采购环节,降低采购...
深度好文:质量只是旅程,而不是终点

深度好文:质量只是旅程,而不是终点

做QA应该是水无常形,兵无常法。Check list、指标仅仅是冰山一角,最关键需要建立的是人对产品质量态度和...
员工执行力不行,与员工无关!警醒无数管理者

员工执行力不行,与员工无关!警醒无数管理者

部下的素质低,不是你的责任;但不能提高部下的素质,是你的责任。——张瑞敏 “执行力”一直以来是个热门话题,这也...
通用汽车供应商管理16步法

通用汽车供应商管理16步法

1.初级评估 定义: 在进行潜在供应商评估之前,对新的潜在的供应商做一个初步的现场评估,或让供应商自我评估以确...
即刻尝鲜
空气悬架高度传感器靠谱吗?

空气悬架高度传感器靠谱吗?

高度传感器在电控悬架系统中,用于检测车身与车轮之间的相对高度,为悬架控制系统提供车身高度信息,以便自动调节车身...
麦格纳工装夹具设计培训教材+要点总结

麦格纳工装夹具设计培训教材+要点总结

工装夹具设计一般是在零件的机械加工工艺过程制订之后按照某一工序的具体要求进行的。制订工艺过程,应充分考虑夹具实...
ISO9001-2026与ISO 9001-2015标准对照表

ISO9001-2026与ISO 9001-2015标准对照表

把新版和 2015 版做了一份对照表,哪些条款变了,哪些只是重新组织结构,哪些地方是真正收紧、以后要重点关注的...
东北大学长篇综述:高熵合金搅拌摩擦焊接与加工中的微观组织与力学性能

东北大学长篇综述:高熵合金搅拌摩擦焊接与加工中的微观组织与力学性能

【研究背景】:高熵合金(HEAs)作为多主元合金体系,近年来因其独特的成分设计、可调控的微观组织以及优异的综合...
车间自检互检制度培训

车间自检互检制度培训

不接受不良品 · 不制造不良品 · 不传递不良品 🎯 培训目标 通过本培训,您将能够: ✅ 理解自检互检制度的...
最新评论
大师兄 大师兄 独立事件和卡方检验,都是非常重要的质量管理概念,挺难理解的。
透彻理解卡方检验 - 汽车质量管理笔记 透彻理解卡方检验 - 汽车质量管理笔记 […] 化简后的式子是我们在卡方检验中需要用到的式子,所以请大家牢记!对于上述式子有疑惑的读者可以学习基础的概率论,也可以参考我之前写的一篇关于独立的文章(《【直观数学】如何理解两事件间的独立关系》)。如果没有问题的话,我们可以进入到卡方检验原理与步骤的主体介绍部分! […]
infinite cui infinite cui 需求VDA6.3 表格,谢谢
大师兄 大师兄 说的挺有道理的,从现实看到的大部分情况,做技术的人都比较直,对技术的一丝不苟,容易在遇到需要展现管理能力的时候,就会表现出短板来。管理需要授权,更多应该思考团队、部门间,人员发展,对未来的变化做出应对等的能力。
大师兄 大师兄 抱歉,暂无PPT可供下载。
john john 如何获得这个PPT文件
大师兄 大师兄 里面确实有一些叫法和我们平时不一样
大师兄 大师兄 这个案例来自一本教科书,短短一页不到的案例描述,有可能漏掉某些细节。我想马自达的员工不会不知道这点,很可能是案例没有提到。马自达的员工更愿意偏离规范不过是这本教科书的猜测罢了。因为象传输系统这么复杂的产品,做得好与做得不好都可能有多个原因。我从另一个案例分析中发现,马自达的最终产品还是比福特的更满足规范要求。 变更控制是必要的。
PeriMasto PeriMasto 这个写的不错,很实用,谢谢!
生产、质量及技术三个难兄难弟的关系 | 汽车质量人小馆 生产、质量及技术三个难兄难弟的关系 | 汽车质量人小馆 […] 附:《生产质量管理十六字精髓》(点击可查具体讲解) […]