体外诊断试剂临床试验指导原则征求意见稿的统计学探讨

2018-12-17 09:29 阅读数：8522 标签：

前言

原NMPA于2014年9月11日发布《体外诊断试剂临床试验技术指导原则》（下称原指导原则），该指导原则从临床试验的基本原则、临床试验设计原则等方面对体外诊断试剂临床试验提出要求，规范体外诊断试剂的临床试验。

2018年11月22日CMDE发布《体外诊断试剂临床试验指导原则（征求意见稿）》（下称征求意见稿）。相比原指导原则，征求意见稿从基本原则、试验设计、质量管理等多方面对体外诊断试剂临床试验规范进行更加详细的规定，对临床试验的执行和操作提出更高的要求。本文将从统计的角度，对比原指导原则，探讨征求意见稿的变化。

对比与探讨

统计分析方法

原指导原则未对统计分析方法进行详细描述，而在征求意见稿中占据较大的篇幅，详细规定统计分析的要求。

无论是定性、半定量还是定量的体外诊断试剂，计算其评价指标时都应当提供点估计值和95%置信区间。点估计值是评价考核试剂在本次临床试验的中的检测性能，比如灵敏度、特异度、斜率和截距等。95%置信区间是评价考核试剂在总体人群中的检测性能。通过点估计和95%置信区间综合评价该试剂的检测准确性。

征求意见稿中对定量检测试剂的一致性评价提供了Deming回归、Passing-Bablok回归和最小二乘回归等方法，申办方或统计单位应当根据数据的分布情况选用合理的回归分析方法。最小二乘回归要求因变量与自变量关系为线性、误差服从均数为0的正态分布且方差相等、各观测独立、X精确无误差（类似于金标准）等比较严格的条件，否则得出的结论可能并不准确。在相当一部分临床试验当中，数据不能完全满足最小二乘回归的要求，此时可以考虑Deming回归、Passing-Bablok回归，计算相对合理的结果。需要注意的是，相关系数r并不能作为一致性评价的标准之一，它是描述数据分布情况的统计量，通常认为r>0.975时数据的分布情况良好。

征求意见稿中并未提及配对t检验、Mcnemar检验等差异性检验方法，或者通过差异性检验P>α来证明一致性。原因在于假设检验的思想是基于反证法，证明体外诊断试剂（下称考核试剂）和对比检测方法（下称参比方法）的检测结果“差异是否有统计学意义”，差异性检验目的是检验“差异性”，而非“一致性”。即使是“差异无统计学意义”也不能说明两种检测方法的检测结果“相等”。就比如比较两个人的身高，身高的测量精度是可以不断提高的，所以我们总是无法证明两人身高“相等”，但是能够发现在某一精度下两人身高的不同。

临床试验样本量

原指导原则要求体外诊断试剂临床试验样本量需要符合指导原则的最低样本量，同时需要符合统计学要求，并给出了各类体外诊断试剂的最低样本量要求。在征求意见稿中对临床试验样本量提出了更多要求：①满足统计学要求；②如果有亚组人群、多种被测物，需要细化各亚组的例数；③如果临床试验需要验证多个目的，则需要根据目的分别计算样本量。根据研究目的的关联性、方案设计取样本量最大值或者样本量之和；④采集样本的数据应该充分反映体外诊断试剂的检测范围、检测性能。除此之外，征求意见稿中还提供了两种定性检测试剂的样本量计算方法。2.1中提供的是抽样调查样本量计算公式，通常用于在满足期望精度水平的前提下，估计诊断试验的灵敏度或特异度的总体参数。2.2中提供的单组目标值计算公式，常用于证明灵敏度或特异度不低于某个临床认可的标准（即目标值）。征求意见稿中未提供定量检测试剂的样本量计算公式，希望在正式文件中能够得到补充。

征求意见稿没有再对各类体外诊断试剂规定最低样本例数，此举可能是将样本量的决定权交给研究者、申办方，在合理合规的条件下，申办方、研究者根据产品特点、性能、相应指导原则计算样本量。

在《乙型肝炎病毒脱氧核糖核酸定量检测试剂注册技术审查指导原则》、《丙型肝炎病毒核糖核酸测定试剂注册技术审查指导原则》中体现了第②点的思路。HBV、HCV的存在不同的基因型，比如HBV有A、B、C、D等分型，HCV也有6个基因型，各种基因型（亚组人群）最好能够收集一定的样本。可能有部分试剂可以通过不同的被测物来检测，比如HBV或HCV可以采集血清或者血浆进行检测，则两者都应该有一定的例数。

多数情况下，一个临床试验对应一个主要验证目的，为了这一个主要验证目的来计算临床试验所需样本量。但是当临床试验包含两个或者多个主要验证目的的时候，需要分别对每一个主要验证目的计算样本量，并取最大值或者样本量之和作为本试验的样本量，则可以满足每一个主要验证目所需的样本量。征求意见稿的例子是同时证明考核试剂与同类产品的等效性、考核试剂与金标准诊断的准确性。由于两个验证目的所采用的的对比方法不同，需要分别计算考核试剂与同类产品的阳性符合率、阴性符合率，与金标准对比的灵敏度、特异度，所以需要分别计算样本量，根据试验设计取两者最大值或者两者之和，才能有效证明考核试剂与同类产品、金标准作对比时的准确性。

为了能够充分证明考核试剂的检测性能，定量检测试剂的临床试验样本应当尽量覆盖说明书声称的检测范围，特别是接近检测范围上限和下限的样本，以此证明考核试剂在检测范围内的准确性和可靠性。医学决定水平附近或灰区的样本是判断部分定性检测试剂检测性能的关键点之一。因为检测值直接关系到定性的判断，若有不可接受的误差，就有可能作出错误的判断，考核试剂就会有较高的误诊率或漏诊率。

偏倚的控制

原指导原则没有特定的章节叙述偏倚的控制，控制偏倚的要求散落在指导原则各个地方，比如第3页要求统一方案和操作方法、第5页要求采用同步盲法测试。在征求意见稿中有独立的章节对偏倚的控制提出具体要求，包括①提出盲法检测的步骤；②要求参比方法与考核试剂同步检测，并阐释原因；③充分考虑并控制试验的干扰因素；④要求临床试验全过程均应控制偏倚。

关于第①点要求，原指导原则中只是提出要采用盲法并强调盲法是“关键”，但对于盲法并没有详细的要求和定义。每个人对于盲法的理解可能都是不一样的，所以在进行临床试验时所采用的盲法就各不相同。所以为了使临床试验更加规范、统一，在征求意见稿中将盲法的具体操作进行详细的描述：体外诊断试剂的比较研究试验中应对受试者样本设盲，并使检测顺序随机，以避免因操作者和检测结果的评价者知晓受试者的疾病诊断或对比试剂检测结果等信息而引入偏倚。在这一段描述中有两个重点：a)对受试者样本设盲；b)使检测顺序随机。

关于第②点同步检测，在原指导原则和征求意见稿中均有要求。在征求意见稿中增加描述同步检测的原因，强调同步检测的重要性，引起临床试验相关人员的重视。

以下为同步盲法检测的步骤，供读者参考。

第①、②点是对检测过程的偏倚控制，第③、④点是对其他重要影响因素的要求。比如各个临床试验中心尽量选择相同的仪器、统一临床试验操作和判定标准，以降低各个中心间的分析结果有统计学差异（即中心效应）发生的可能性。如果出现中心效应，则难以评价考核试剂检测的准确程度，不利于产品的注册上市。统计分析方法应当在方案设计时准确定义，在统计分析阶段应当按照方案规定的统计分析方法执行。同一个参数可能可以通过多种统计方法计算得到，所以如果不按照方案执行，会被怀疑采用了有利于产品的统计方法，不能真实反映产品的检测准确性。上述只是需要控制偏倚的部分内容，在临床试验过程中有许许多多的影响因素需要充分考虑并进行合理控制。

总结

相比原指导原则，征求意见稿的内容发生了比较大的变化，增加了许多规范和要求，从试验设计、执行、质控、统计等各方面提出要求，相信会使体外诊断试剂临床试验的质量得到较大的提升，使更多性能优良的体外诊断试剂获批上市，提升我国人民的生命健康质量。

作者：

卢坤明广州奥咨达医疗器械技术股份有限公司生物统计部

参考文献

[1] 国家食品药品监督管理总局，体外诊断试剂临床试验技术指导原则[S]，2014

[2] 国家食品药品监督管理总局医疗器械技术审评中心，体外诊断试剂临床试验指导原则（征求意见稿）[S]，2018

[3] 国家食品药品监督管理总局，乙型肝炎病毒脱氧核糖核酸定量检测试剂注册技术审查指导原则[S],2013

[4] 国家食品药品监督管理总局，丙型肝炎病毒核糖核酸测定试剂注册技术审查指导原则[S],2015

[5] 孙振球，徐勇勇等，医学统计学[M]. 第3版. 人民卫生出版社, 2013.

[6] 胡丽涛，王薇，王志国，回归和多元分析在参考物质互换性研究中的应用[J]，中国卫生统计，2012，29(3)：462-464

[7] H.Passing, W.Bablok, A New Biometrical Procedure for Testing the Equality of Measurements from Two Different Analytical Methods[J], J. Clin. Chem. Clin. Biochem, 1983, 21: 709-720