(四)临床评价指标 临床评价指标应在临床试验的设计阶段确定,并在临床试验方案中予以明确。 定性检测的体外诊断试剂临床试验评价指标通常包括诊断准确性(灵敏度、特异度、预测值、似然比、ROC曲线下面积等)或检测一致性(阳性/阴性符合率、总符合率、Kappa值等)。 半定量检测的体外诊断试剂临床试验评价指标通常包括:各等级符合率、阴/阳性符合率及Kappa值等。 定量检测的体外诊断试剂临床试验评价指标通常包括回归分析的回归系数、截距、相关系数和决定系数等。 (五)临床试验的统计学分析 临床试验结果的统计分析应建立在正确、完整的数据基础上,选择适当的临床评价指标来评价体外诊断试剂的临床性能,并采用适当的统计模型对数据进行分析。 1. 统计学分析的基本考虑 体外诊断试剂的统计分析一般包括评价指标的参数估计(含置信区间估计)和假设检验。参数估计是在保证评价指标满足期望精度水平(置信区间的宽度一定)的前提下,确认灵敏度、特异度、(回归方程的)回归系数和截距等评价指标的水平。假设检验则需对统计学指标提出无效假设及备择假设,通过假设检验进行相关统计学推断。如有必要,需在统计分析之前考虑对样本的分布假设进行验证,从而合理选择统计方法。 对于有确定的临床可接受标准的研究,应在临床试验方案中明确接受标准,并经过临床试验数据的统计学分析证明临床评价指标的评价结果(区间估计)满足可接受标准要求。临床可接受标准应为行业广泛认可的结果,一般依据相关检测试剂的性能水平、风险判定和临床需求等因素进行设定。 1.1定性检测的统计学分析 定性检测临床试验一般以2×2表的形式总结两种分析方法的检测结果,并据此计算灵敏度(阳性符合率)、特异度(阴性符合率)、总符合率、Kappa值等指标及其置信区间。 除此之外,还可同时进行假设检验评价两种分析方法的一致性。 1.2半定量检测的统计学分析 半定量检测的体外诊断试剂通常是指:检测结果报告为几个等级值(例如:阴性、+、2+、3+)、或者报告为终点稀释度的试剂等。临床试验可采用R×C表形式总结检测结果,并据此计算各等级的符合率、阴/阳性符合率及Kappa值等指标及其置信区间。 1.3定量检测的统计学分析 1.3.1应根据临床试验数据绘制散点图,并进行相关性分析。 1.3.2采用Bland-Altman法,计算一致性限度,评价两种检测结果的一致性。一致性限度应在临床所能接受的界值范围内。 1.3.3采用回归分析对两种检测方法的一致性进行评价。应根据数据分布特点等因素选择适用的回归分析方法,如Passing-Bablok回归、Deming回归和最小二乘回归等。回归分析应重点观察回归方程的回归系数和截距等指标,计算回归系数和截距的置信区间。亦可同时对相关评价指标进行假设检验。 1.3.4应特别针对医学决定水平附近的检测结果进行分析。 1.4 ROC分析 对于试验体外诊断试剂检测结果为定量或半定量数据,临床参考标准判断结果为定性结果的统计学分析,也可采用受试者工作特征(ROC)曲线的方法,以ROC曲线下面积反映试验体外诊断试剂检测的诊断价值,或同时比较两种试剂的诊断价值。对于体外诊断试剂的临床试验,采用ROC分析方式进行数据统计时仍应进一步以推荐的阳性判断值进行灵敏度、特异度等指标(及其置信区间)的评价。 2. 定性检测的不一致样本分析 在定性检测试剂临床试验中,如有试验体外诊断试剂与对比方法检测结果不一致的情况,应对不一致结果进行综合分析,说明是否影响对产品临床性能的判定;对检测结果不一致的样本可采用临床参考标准或其他恰当的方法进行分析,但该分析结果不应纳入原有统计分析。 3. 如有必要,应对获得的数据集进行分层、分段统计。 4. 纳入临床试验的样本不应随意剔除,应在临床试验方案中设定样本剔除标准;如有任何剔除,应在临床试验小结和报告中详细列出所有样本剔除的情形,并说明理由。 5. 在体外诊断试剂临床试验的全过程中,生物统计学分析的结论非常重要,同时也要充分考虑到临床诊疗对于体外诊断试剂临床性能的要求;在产品安全有效性的评价中,应综合考虑评价结果的统计学意义及其所代表的临床意义。 (六)样本量要求 适当的样本量是保证体外诊断试剂临床性能得到准确评价的必要条件。体外诊断试剂临床试验的样本量与多种因素相关,包括评价指标、检测的可重复性、干扰因素、亚组间的差异性、以及被测物特点等。临床试验方案中应对临床试验需要的最低样本量进行估算,并说明依据。 1. 关于样本量要求的基本考虑 1.1临床试验样本量应满足统计学要求,应采用适当的统计学方法进行估算。 1.2临床试验样本量的确定应考虑临床性能的各种影响因素,保证对临床性能的充分评价,如:受试人群应能够代表目标人群的各种特征,考虑到不同亚组中检测性能的评价需要,以及多种被测物(或多种亚型等)检测性能评价的要求,应在估算最低总样本量的基础上,保证各种组别/类型样本的例数满足要求。当体外诊断试剂临床性能预期在不同亚组的人群中有差异,且对某些重要亚组的临床性能需得到准确评价时,应对亚组样本量单独进行统计学估算。 1.3如果试验体外诊断试剂适用于不同的样本类型,则还需考虑不同样本类型的样本量要求。 采用不同样本类型检测相同被测物时,可能因其样本基质差异、被测物来源差异、被测物浓度水平差异、干扰因素差异以及采样部位差异等因素导致产品分析性能、临床性能以及适用人群、适应证、参考区间等方面的差异。针对不同样本类型应考虑上述差异造成的影响,确定合理的样本量要求。 如不同样本类型在临床性能、适用人群、适应证、参考区间等方面存在显著差异,需针对不同的样本类型分别进行临床试验设计,包括分别进行样本量估算和统计学分析。 如通过临床前研究证明不同样本类型之间存在分析性能差异,但不对临床性能造成显著影响,例如某些免疫学检测中的血清与全血样本,则临床试验中应以一种样本类型为主进行临床试验,样本例数满足统计学要求;其他样本类型适当纳入一定数量阳性和阴性样本,通过同源样本对比试验或与对比方法的比较研究进行临床性能的评价。 如不同样本类型在样本基质、被测物来源、被测物浓度水平、干扰因素以及采样部位等方面几乎没有差异,且经临床前研究证明分析性能没有差异,例如某些检测中的血清和血浆样本,则临床试验中不同样本类型可进行汇总统计。 1.4如果临床试验包含不同的临床试验目的,则需分别进行临床试验设计,包括分别进行相应的样本量估算。例如:临床试验目的包括:①评价试验体外诊断试剂与对比试剂的检测一致性研究;②评价试验体外诊断试剂用于疾病鉴别诊断的灵敏度和特异度,则针对上述两个临床试验目的,应分别进行临床试验设计,并估算最低样本量。 1.5对于定量检测试剂,在线性范围内的各个浓度水平均应有一定量的样本例数,并着重考虑对医学决定水平的检测性能进行充分验证;对于定性检测试剂,临床试验样本则应包含一定数量的阳性判断值附近样本(如涉及)。 2. 采用统计学方法进行样本量估算 采用统计学公式进行样本量估算的相关要素一般包括评价指标的预期值、评价指标的可接受标准(如适用)、Ⅰ类和Ⅱ类错误概率以及预期的受试者脱落剔除率等。 应在方案中明确用于样本量估算的评价指标。评价指标的预期值根据已有临床数据(基于目标人群样本)、小样本探索性试验(如有)的结果或其他适当的评价数据来设定,应在临床试验方案中明确这些参数的确定依据。 一般情况下,Ⅰ类错误概率α设定为双侧0.05或单侧0.025,Ⅱ类错误概率β设定为不大于0.2。 本文附件中举例说明几种常见的样本量估算方法,供参考。 3. 应注意,样本量估算仅仅是基于统计学要求的最低样本量估计,临床试验样本量应以临床性能得到充分评价为目标,保证目标人群的各种特征均有充分数量的代表性受试者入组,从而使临床试验结果全面、真实地反映目标人群的情况。 (七)偏倚的控制 偏倚是指在临床试验方案设计、实施及结果分析时,有关影响因素所致的系统误差,致使对试验体外诊断试剂安全有效性的评价偏离真值。偏倚干扰临床试验得出正确的结论,在临床试验的全过程中均需防范其发生。 1.盲法:体外诊断试剂的比较研究试验中应对试验体外诊断试剂和对比方法(如有)的试验操作者和结果评价者设盲,使其在试验过程中不知晓受试者的疾病诊断或其他相关检测结果等信息,从而避免引入偏倚。 2.试验体外诊断试剂检测应与临床参考标准的判断或对比方法检测尽量同步进行,以避免因疾病进程不同或样本保存时间差异较大而造成临床试验结论偏离真值。 3.在临床试验机构选择、受试者选择、试验过程、统计学分析等各个阶段均需进行偏倚的控制。例如:受试人群应尽可能代表目标人群的特征,以避免选择偏倚;不同临床试验机构在临床试验中应统一试验操作和判读标准等,以避免中心效应的发生。 (八)临床试验设计中还需考虑的其他因素 体外诊断试剂的一些固有特征可能影响临床试验设计中的关键要素,在进行临床试验设计时,应加以考虑,包括体外诊断试剂的检验原理、使用方法(包括对技能水平的要求等)、使用条件(使用者和使用环境)、使用中人为因素的影响等。 例如: 1.预期供消费者个人自行使用的体外诊断试剂,临床试验中,除需评价试验体外诊断试剂临床性能以外,还需评价无医学背景的消费者对产品说明书的认知能力,并证明无医学背景消费者与专业检验人员检测结果的一致性。 2. 如果体外诊断试剂的检测操作和数据处理、解读等对使用者有专门的技能要求,则临床试验中对试验人员的技能水平、培训要求等应能够代表该产品上市后对预期使用者的要求。
|