三、试验设计的基本考虑
(一)试验设计的基本类型
1.平行组设计
平行组设计是最常用的临床试验设计类型,可为试验药设置一个或多个对照组,试验药也可设多个剂量组。对照组可分为阳性或阴性对照。阳性对照一般采用按所选适应症的当前公认的有效药物,阴性对照一般采用安慰剂,但必须符合伦理学要求。试验药设一个或多个剂量组完全取决于试验的目的。
2.交叉设计
交叉设计是按事先设计好的试验次序,在各个时期对受试者逐一实施各种处理,以比较各处理间的差异。交叉设计是将自身比较和组间比较设计思路综合应用的一种设计方法,它可以较好地控制个体间的差异,以减少受试者人数。
最简单的交叉设计是2种药物2个阶段的形式,又称2×2交叉设计,对每个受试者安排两个试验阶段,分别接受A、B两种试验用药物,而第一阶段接受何种试验用药物是随机确定的,第二阶段必须接受与第一阶段不同的另一种试验用药物。因此,每个受试者接受的药物可能是先A后B(AB顺序),也可能是先B后A(BA顺序),故这种试验又简记为AB/BA交叉试验。两阶段交叉试验中,每个受试者需经历如下几个试验过程,即准备阶段、第一试验阶段、洗脱期和第二试验阶段。
每个试验阶段的用药对后一阶段的延滞作用称为延滞效应。前个试验阶段后需安排足够长的洗脱期或有效的洗脱手段,以消除其延滞效应。采用交叉设计时应考虑延滞效应对试验数据分析评价的影响。
2×2交叉设计难以区分延滞效应与时期-药物的交互作用。如需进一步分析和评价延滞效应,则可考虑采用2个处理多个阶段的交叉设计(例如:2×4的ABBA/BAAB交叉设计)。
多种药物多个阶段的交叉设计也是经常用到的,例如:3×3交叉设计,即3种处理(A、B、C)、3个阶段、6种顺序(ABC/BCA/CAB/ACB/CBA/BAC)的交叉设计。
由于每个受试者接受了所有处理组的治疗,提供了多个处理的效应,因此交叉试验中应尽量避免受试者的失访。
3.析因设计
析因设计是通过试验用药物剂量的不同组合,对两个或多个试验用药物同时进行评价,不仅可检验每个试验用药物各剂量间的差异,而且可以检验各试验用药物间是否存在交互作用,或探索两种药物不同剂量的适当组合,常用于复方研究。析因设计时需考虑两种药物高剂量组合可能带来的毒副反应。
如果试验的样本量是基于检验主效应的目的而计算的,关于交互作用的假设检验,其检验效能往往是不足的。
(二)多中心试验
多中心试验系指由一个单位的主要研究者总负责,多个单位的研究者参与,按同一个试验方案同时进行的临床试验。多中心试验可以在较短的时间内入选所需的病例数,且入选的病例范围广,临床试验的结果更具代表性。但影响因素亦随之更趋复杂。
多中心试验必须遵循同一个试验方案在统一的组织领导下完成整个试验。各中心试验组和对照组病例数的比例应与总样本的比例大致相同。多中心试验要求试验前对人员统一培训,试验过程要有良好的质控措施。当主要指标易受主观影响时,需进行统一培训并进行一致性评估。当主要指标在各中心的实验室的检验结果有较大差异或参考值范围不同时,应采取相应的措施进行校正或标化以保证其可比性,如采用中心实验室检验等。如预期多中心间检验结果有较大差异,应在临床试验方案中预先规定可能采用的差异性的检验及校正方法。
在多中心临床试验中,可按中心分层随机;当中心数较多且每个中心的病例数较少时,可不按中心分层。
国际多中心试验可视为一种特殊形式的多中心试验,在不同国家或地区所观察的试验结果可能作为相应国家或地区药品注册申请的重要依据。在这种特殊的需求下,国家或地区间的临床实践差异有可能对临床结果的解读产生较大的影响。在临床试验设计时应提前对这种差异进行预估,并在临床试验方案中对将采用的分析不同国家地区结果差异性/一致性的统计方法做预先规定。常用的一致性的评价方法有(但不限于)以国家或地区为预设亚组的亚组分析,或采用适当的统计分析模型等。当单独以某特定国家或地区试验数据作为主要注册申请依据时,应说明样本量能够合理的支持相对应的安全性及有效性的评价。
(三)比较的类型
临床试验中比较的类型,按统计学中的假设检验可分为优效性检验、等效性检验和非劣效性检验。在临床试验方案中,需要明确试验的目的和比较的类型。
优效性检验的目的是显示试验药的治疗效果优于对照药,包括:试验药是否优于安慰剂;试验药是否优于阳性对照药;或剂量间效应的比较。等效性检验的目的是确证两种或多种治疗的效果差别大小在临床上并无重要意义,即试验药与阳性对照药在疗效上相当。而非劣效性检验目的是确证试验药的疗效如果在临床上低于阳性对照药,其差异也是在临床可接受范围内。
在显示后两种目的试验设计中,阳性对照药的选择要慎重。所选阳性对照药需是已广泛应用的、对相应适应症的疗效和用量已被证实,使用它可以有把握地期望在目前试验中表现出相似的效果;阳性对照药原有的用法与用量不得任意改动。阳性药物选择时应考虑以下两个方面:
1.阳性对照有效性的既有证据
阳性对照效应来源于文献报道的有良好试验设计的试验结果,这些历史试验已明确显示本次非劣效试验中采用的阳性对照或与其类似的药物优于安慰剂,且随时间迁移,阳性对照的疗效基本维持稳定。根据这些试验结果可以可靠地估计出阳性对照的效应大小。阳性对照的效应量是非劣效试验的关键设计参数(用以确定非劣效界值),既不能用历史研究中最好的疗效作为其效应量的估计,也不能仅用荟萃分析的点估计作为效应量的估计,效应量估计时要充分考虑历史研究间的变异。
2.阳性对照药物效应的稳定性
阳性对照效应的估计来源于历史研究,虽然考虑了历史研究间的变异,但仍有历史局限性,受到很多因素诸如当时的受试人群、合并用药、疗效指标的定义与判定、阳性对照的剂量、耐药性以及统计分析方法等的影响。因此,采用非劣效试验设计时要尽可能地确保本次临床试验在以上提及的诸多因素方面与历史研究一致。另外非劣效/等效性设计,良好的偏倚控制和质量控制是此类设计的关键。因此,在试验设计和实施阶段都应该提高试验质量要求,只有高质量的临床试验才能保证非劣效/等效临床试验的检定灵敏度。
进行等效性检验或非劣效性检验时,需预先确定一个等效界值(上限和下限)或非劣效界值(上限或下限),这个界值应不超过临床上能接受的最大差别范围,并且应当小于阳性对照药与安慰剂的优效性试验所观察到的差异。非劣效界值确定一般采用两步法,M1是阳性对照扣去了安慰剂效应的绝对疗效的保守估计,一般借助荟萃分析法并考虑历史试验间的变异后确定;M2是非劣效界值,其确定要结合临床具体情况,在考虑保留阳性对照疗效的适当比例f后,由统计专家和临床医学专家共同确定。在等效界值的确定中,可以用类似的方法确定下限和上限。从技术层面讲,等效性检验双侧置信区间等同于两个同时进行的单侧假设检验,而非劣效检验是单侧检验。非劣效/等效检验统计推断一般采用置信区间法。值得注意的是两组之间差别无统计学意义并不能得出两组等效或非劣的结论。
|