偏倚

科普中国-科学百科 2018-03-18

　　测量学中偏倚是指一切测量值对真值的偏离。包括测量仪器的不准，样本过小，试验设计不合理，分配或分组不均衡，抽样未随机，测量者有主观倾向等。医学研究中偏倚是指在临床研究中，研究结果总是会或多或少的偏离真实情况，这种偏离我们称之为误差(error)。在不同的学科中对偏倚的解释差别不大，统指与目标有所偏离的意思。

　　测量学

　　任何试验必须尽可能排除偏倚，否则统计结论不可信。要保证试验无偏倚，必须有精确的测量方法，一定的样本量，周密的试验设计，随机化的抽样及分组，避免试验者的主观偏见等。

　　医学研究定义

　　医学研究中的偏倚（bias）是指从研究设计、到实施、到数据处理和分析的各个环节中产生的系统误差，以及结果解释、推论中的片面性，导致研究结果与真实情况之间出现倾向性的差异，从而错误地描述暴露与疾病之间的联系。1

　　虽然要在研究工作中完全避免误差几乎是不可能的，但对于研究中可能存在的各种误差，我们要在临床研究工作的各个环节中尽量加以控制和预防，以使研究结论更符合实际情况。　从某种意义上讲，偏倚是抽样调查所无法避免的误差。也就是说，只要是抽样，就会产生偏倚。相应地，要最大限度地控制偏倚，只能通过多次抽样、预实验等手段加以判断。由于许多调查或实验是无法重复或进行预实验的，所以经验在偏倚的处理上也是非常重要的。

　　临床研究中误差的来源可以分为两类：一类是随机误差（random error）；一类是系统误差（systematic error）。

　　随机误差：是由于抽样误差所引起的，其大小可以用统计学方法进行估计，但没有方向性，也就是说，这种误差的存在使研究结果随机的高于或小于真值。

　　系统误差即偏倚（bias）：是指研究结果系统地偏离了真实情况。与随机误差不同，偏倚的存在总是造成研究结果或高于真值或低于真值，因而具有方向性。由于在研究工作中定量的估计偏倚的大小很困难，而确定偏倚的方向却相对较容易。当偏倚使研究结果高于真值时，称之为正偏倚，反之，偏倚使研究结果低于真值时，称之为负偏倚。

　　分类

　　即选择偏倚、信息偏倚、混杂偏倚。

　　选择偏倚：出现于研究设计阶段，指由于研究对象选择不当而使研究结果偏离真实情况而产生偏倚。研究设计上的缺陷是选择偏倚的主要来源，在确定研究对象时表现得最为突出。常见的情况是在研究开始时实验组和对照组就存在着除诊疗措施以外的差异，而缺乏可比性。2

　　信息偏倚：又称观察偏倚、测量偏倚，是指研究过程中进行信息收集时产生的系统误差。测量方法的缺陷，诊断标准不明确或资料的缺失遗漏等都是信息偏倚的来源。

　　混杂偏倚：流行病学研究中，由于一个或多个外来因素的存在，掩盖或夸大了研究因素与疾病的联系，从而部分或全部地歪曲了两者间的真实联系，称之为混杂偏倚（confounding bias）或混杂（confounding）。引起混杂的因素称为混杂因子（confounder）。

　　偏倚的控制

　　1.严格遵照抽样方法的要求，确保抽样过程中随机化原则的完全实施，

　　2.提高研究对象的依从性和受检率

　　3.正确选择测量工具和检测方法，包括调查表的编制等

　　4.组织好研究工作，调查员一定要经过培训，统一标准和认识

　　5.做好资料的复查、复核工作

　　6.选择正确的统计分析方法，注意辨析混杂因素及其影响1

　　数字偏倚

　　数字偏选(digit preference)是指由于对某些数字的偏好,导致对某种测量结果用近似数字来记录。例如用最接近的整数、偶数、5或10的倍数,或者是7、14(当时间单位用周时)等，由此可以导致数字偏选偏倚(digit preference bias)，这种偏倚可以是观察者变异的一种形式，或者是调查中应答者变异的一种表现。3

　　汽车用语

　　指由同一操作人员使用相同量具, 测量同一零件之相同特性多次数所得平均值与工具室或精密仪器测量同一零件的相同特性所得的真值或参考值之间的偏差值。是测量结果的观测平均值与基准值的差值。真值的取得可以通过采用更高级别的测量设备进行多次测量，取其平均值而定。

　　为了在过程范围内指定的位置确定测量系统的偏倚，得到一个零件可接受的基准值是必要的。通常可在计量室或全尺寸检验设备上完成。基准值从这些读数中获得，然后这些读数要与研究评价人的一组观察平均值(定为XA，XB，XC)进行比较。

　　如果不能按这种方法对所有样件进行测量，可采下列替代的方法：

　　1.在计量室或全尺寸检验设备上对一个基准件进行精密测量。

　　2.让一位评价人用正被评价的量具测量同一零件至少十次。

　　3.计算读数的平均值。基准值与平均值之间的差值表示测量系统的偏倚。

　　如果需要一个指数，把偏倚乘以100再除以过程变差(或公差)，就把偏倚转化为过程差(或公差)的百分比。

　　计算偏倚:

　　偏倚= 观测平均值 – 参考值

　　制造过程变异= 6σ（也可以用公差）

　　%偏倚=偏倚/制造过程变差（也可以用公差）

　　如果偏倚相对比较大，查看这些可能的原因

　　1.基准的误差

　　2.磨损的零件

　　3.制造的仪器尺寸不对

　　4.仪器测量非代表性的特性

　　5.仪器没有正确校准

　　6.评价人员使用仪器不正确。

　　选择性偏倚入院率偏倚

　　倚在选择研究对象时，试验组和对照组的设立（纳入标准）不正确，使得这两组人在开始时即存在处理因素以外的重大差异，从而产生偏倚。常见的主要有：

　　就诊机会偏倚（入院率偏倚）：由于疾病严重程度不同、就医条件不同、人群对某一疾病的了解和认识程度不同等原因而使患不同种类疾病的人（或有某种特性者）的住院率不同。从医院选取对照时，如果没有注意到此点，则可引起偏倚。

　　新发病例偏倚

　　现患病例及新发病例偏倚：此种偏倚易出现在病程较短的严重致死性疾病，如心肌梗死，部分病例在送到医院前已死亡，如果只以存活的现患病例为对象，研究某因素的作用，必然产生偏倚。这些死亡病例通常未计入心肌梗死总发病人数中，以至于所报道的患病数少于实际的发病数。又如，在病例对照研究中有意或无意排除（或加入）某些病例，也可出现偏倚，如研究吸烟与肺癌的关系时，对照组包括了慢性支气管炎和冠心病，由于此二病均与吸烟有关，所以吸烟与肺癌的OR减低，甚至于看不出吸烟作为肺癌的病因作用。患病后改变生活习惯也可以使用病例对照方法探讨病因出现偏倚，如患肺癌后戒烟，患高血压后将饮食口味调淡、不吃动物脂肪（肥肉）、适当增加体力活动等等，都可在病例对照研究中使这些因素的病因作用被抵消。又如，乳腺癌与利血平关系的病例对照研究，在对照组中排除了心血管病人（其中有相当多的高血压病人，他们服用利血平），所以得出利血平是乳腺癌的危险因素的结论。另一个研究将全部病例均纳入，则未发现此相关。4

　　检出信号偏倚

　　检出信号偏倚：某因素如能引起或促进某症候（与所研究疾病的体征或症状类似）的出现，使患者因此而去就医，这就提高了该病的检出机会，使人误以为某因素与该病有因果联系。这种虚假联系造成的偏倚称为检出信号（或检出症候）偏倚。如，曾有研究发现子宫内膜癌与绝经期服用雌激素有关。这个研究结果是因为绝经期妇女服用雌激素会引起不规则子宫出血，因此而就医，得到检查子宫内膜的机会较多，从而增加了发现子宫内膜癌的机会。不服用雌激素的子宫内膜癌常无明显症状，发现机会较少。以刮宫或子宫切除作为诊断子宫内膜癌的诊断时，绝经期服用雌激素的OR为1.7，而以子宫出血就诊者的OR为9.8，二者相差悬殊。显然，以子宫出血就诊增高了OR。此类偏倚即检出信号偏倚。

　　无应答偏倚

　　无应答偏倚：即研究对象对研究内容产生不同的反应而造成的偏倚。如用通信方式调查吸烟情况，不吸烟者与吸烟者的应答率可以相差悬殊。无应答者的暴露或患病状况与应答者可能不同。如果无应答者比例较高，则使以有应答者为对象的研究结果可能存在严重偏倚。所以在研究报告中必须如实说明应答率，并评价其对结果可能造成的影响。与一部分人无应答相反的情况是有一部分人特别乐意或自愿接受调查或测试。这些人往往是比较关心自身健康或自觉有某种疾病，而想得到检查机会的人。他们的特征或经历不能代表目标人群。由此造成的偏倚称为志愿者偏倚。4

　　总之，无论什么原因使观察组与对照组成员不是来自同一总体，即可造成除研究因素以外的有关因素在两组分布不均衡，从而造成选择偏倚。

　　本词条内容贡献者为:

　　刘军 - 副研究员 - 中国科学院工程热物理研究所

责任编辑：科普云

上一篇：参数

下一篇：四维时空

科普中国APP 科普中国微信 科普中国微博