发布日期 栏目 标题 作者 部门
正文内容
20070405
化药药物评价>>临床安全性和有效性评价
EMEA发布的《非劣效性界值选择的指导原则》
黄钦
审评四部审评八室 黄钦 审校
伦敦,2005年7月27日 索引:EMEA/CPMP/EWP/2158/99 人用药品委员会(CHMP) 生效日期 2006年1月 目录
前言 1.背景 2.一般考虑 3.证明疗效
3.1 三个组的试验:试验产品、参照品和安慰剂 3.2 两个组的试验:试验产品和对照产品 3.3 不能肯定优于安慰剂的情况 4.确定与活性对照药相比可接受的疗效 5. 难以证明有合理非劣效性界值的情况 5.1使用显著性水平升高的优效性 5.2在另一方面有优势的产品 6.结论
前言
许多将一种试验产品与一种活性对照药物进行比较的临床试验被设计为非劣效性试验。目前“非劣效性”这一术语已得到普遍认可,但如果从字面上来理解可能会产生误导。非劣效性试验的目的往往声明为了证实试验产品不亚于对照药物。但只有优效性试验才能证实这一点。事实上非劣效性试验的目的是为了证实试验产品不如对照产品的程度,不超过事先指定的一个较小的量。这个量被称为非劣效性界值(non-inferiority margin),或称为Δ。
在许多情况下,可能进行非劣效性试验而不做优效性试验,或者除了做优效性试验,另外再做劣效性试验。这些情况包括:
l 在某些情况下不可能进行生物等效性研究时(例如缓释产品或局部用制剂),根据基本上相似的情况提出的申请;
l 与标准治疗相比安全性方面可能有优势的产品需要与标准治疗进行疗效比较,以便进行风险-受益评价;
l 需要直接与活性对照进行比较以协助风险受益评价的情况; l 与活性对照相比疗效没有显著降低可以接受的情况;
l 不能用安慰剂组,要用活性对照试验以证实试验产品疗效的某些疾病。
在以上最后4种情况下,如果能显示优于参照产品则不一定要做非劣效性试验。
为证实非劣效性,推荐的方法是在方案中事先指定一个非劣效性的界值。研究完成后,计算出两种药物真正差异的双侧95%可信区间(或单侧97.5%可信区间)。这一区间应当完全在非劣效性界值(non-inferiority margin)的有利一侧。Δ的选择在临床上和统计学方面一定要合理。一定要根据特定的临床情况而具体制定,没有适用于各种情况的统一规则。但某些原则可作为一般指导。
以下法规性的指南可供参考用于选择非劣效性或等效性界值。这些指南要与本指南结合起来看。
l ICH指南E9的注释(临床试验的统计学原理)(ICH Note for Guidance E9 (Statistical Principles for Clinical Trials);
l ICH指南E10的注释(对照组的选择)(ICH Note for Guidance E10 (Choice of Control Group);
l CPMP优效性和非劣效性转换的考虑要点(CPMP Points to Consider on Switching Between Superiority and Non-inferiority)
这些文件中,有关如何选择非劣效性界值的讨论有限。但它们确实就非劣效性研究的设计和操作作了详细的讨论。这些问题极为重要,如果试验的开展没有达到足够高的标准,那么Δ的选择就毫无意义。
本文件讨论两种类型的非劣效性试验:2个组的试验即试验产品和对照品;3个组的试验,即试验产品、活性对照药和安慰剂。
试验产品的表现有许多方面需要考虑。这些大致与疗效和安全性有关,但这些方面的每一项都可以针对每个产品细分为许多关注点。一项临床试验或临床计划可能是为了显示某些变量的非劣效性,而其他一些变量可能需要证明优效性。这份文件中“非劣效性”和“优效性”用于指单个终点而不是整个产品的特点。
始终假定治疗效果可以测定,并且测量值可以区分期望的(正面)与不期望的(负面)作用。再进一步假定所测变量的正面数值越大,则正面作用越大。
文件中多数使用不同治疗之间的绝对差值作为例子来描述这一概念。这些讨论也适用于考虑相对效果的研究,只需进行少量修改即可。例如在一项考虑相对效果的试验中,点估计值为1反映治疗之间无差异,估计值为0则表示有差异。
尽管安全性参数也可定义非劣效性界值,但本文件中提到的方法均使用疗效参数进行描述,因此,对疗效终点的许多讨论不适用于安全性试验,特别是整个第3节。
1.背景
非劣效性试验的结果通常以双侧95%可信区间进行评价,这个区间显示的是试验产品(试验:T)和活性对照药(参照:R)之间真正差异的可信范围。结果中有2个方面应当引起特别注意。一个是差异的点估计值,即所观察到的试验产品和参照产品之间的差异。另一个是可信区间的下限。点估计值表示真正差异的最佳估计值,因此如果它是正数,并且这是所获得的所有证据,那么试验产品很可能优于参照产品,反之亦然。另一方面,可信区间的下限表示较低的限度,其含义通常是根据所列数据可以排除的试验品不如参照产品的程度。事实上这不是一个真正的低限,劣效性的幅度可能更大。但一般认为真正差异比这一限度所提示的差异更不好的机率在一定认可水平非常小。
如果T和R效果相等,那么无论样本量大小,差异的点估计值应当有50%的机率为正数,有50%的机会为负数。因此单纯点估计值不足以作为相对疗效的指标。在真正相等的情况下,差异的可信区间的下限随样本量的增加会逐渐接近于0,因此理论上可以通过足够大的样本来排除任何所期望程度的非劣效性。但如果治疗真正等效时,就不可能设计一个研究来排除所有程度的非劣效,因为这需要规模无穷大的实验。
因此从一开始就要明确,如果T不可能不如R,那么就不能用非劣效性试验开发与对照药疗效相等的产品。
2.一般考虑
l 非劣效性界值的选择要根据统计学推理和临床判断综合考虑。
l 试验药、参照药和安慰剂的三组试验可以在本试验内部对非劣效性界值进行一定程度的验证,因此这是推荐的试验设计;应当尽可能采用。
l 正确选择界值应当确保试验药物临床上有意义的作用大于0。选择界值的这个方面在第3节讨论。
l 通常非劣效性试验的主要焦点是试验产品和参照产品的相对疗效,而不单纯是要证明试验产品有效。在这些情况下,正确选择界值,除了证明产品有效之外,还要证明试验产品不会比参照品差很多,因此得到比较严谨的界值。选择界值的这个方面在第4节讨论。
l 对于大多数非劣效性试验,必须证明界值可以满足第3节和第4节的要求。
在方案中必须说明非劣效性界值选择的合理性,合理性解释中应当解决这两节所考虑的问题。
l 把非劣效性界值定义为活性对照和安慰剂之间差异的比例是不恰当的。形成这种想法,其目的是想确保试验产品优于(假定的)安慰剂;但他们可能达不到这一目的。如果参照产品与安慰剂相比有较大的优势,这并不意味着差异大不重要,它正好说明参照产品非常有效。
l 使用效果大小(治疗差异除以标准差)作为选择非劣效性界值的依据是不恰当的。这个统计量是提供检出有差异的难度方面的信息,但无助于证明差异所具有的临床意义,也不能确保试验产品优于安慰剂。
l 界值的选择应当不考虑把握度。应当根据本文后面章节提到的临床和统计学原理,而不是根据样本量的问题,因为有临床意义的差异的大小不因研究规模的大小而发生变化。不能因为研究的规模小就采用比较宽的非劣效性界值。 l 如果已经选择了一个恰当的非劣效性界值,全部处于-Δ与0之间的可信区间(即试验产品不如参照产品,但相差的程度不超过Δ)仍足以证明非劣效性。如果这一结果不能接受,那么这证明Δ的选择不恰当。(见第V节有关难以判断各种非劣效性数量的情况的讨论)。
l 不可能在所有情况下进行非劣效性试验。根据治疗领域和参照产品的特点考虑进行非劣效性试验的决定应当合情合理。
l 许多情况下疗效已经确定的药物在安慰剂对照的试验中并不能始终如一地证明其优越性(例如抑郁症或过敏性鼻炎)。有这种缺乏灵敏度的情况下,不包括安慰剂组的非劣效性试验是不恰当的。见ICH E10有关灵敏度的更详
细的讨论。
l 如果试验中参照产品的表现与确定非劣效性界值时所假定的表现有很大不同,那么所选的非劣效性界值可能不再合适。这个问题牵涉的情况应当在制定计划的阶段做好考虑。
3.证明疗效
非劣效性试验数据解释中所涉及的决策过程的最低要求是:如果开展安慰剂对照试验,我们必须相信试验产品会有效。本节的讨论采用优效性试验数据解释中常用的方法,作为评价非劣效性试验数据的最低要求的模型。
如果一个试验的目的是证明试验产品优于安慰剂,现在来解释这样一个试验中的数据,应当采用非正式的两阶段方法,同时考虑到统计学意义和临床意义。同样的两阶段方法也可用于解释非劣效性试验。在优效性试验中,首先可能要证明试验产品在统计学意义上优于安慰剂。这指的是ICH E10中“统计学推理和临床判断”相结合的“统计学推理”阶段。统计学意义一般采用双侧0.05(或单侧0.025)的显著性水平来评价。表明符合这一要求的另一种方法是活性药物与安慰剂之间差异的双侧95%可信区间的下限(或单侧97.5%区间)必须大于0。
解释优效性试验的下一步是考虑与安慰剂的差异是否具有临床意义。这是ICH E10中“统计学推理和临床判断”相结合的“临床判断”阶段。
要确定试验产品与安慰剂相比其受益有临床意义,应当同时考虑试验产品与安慰剂之间差异的点估计值,并评价其临床意义,可以用原始数据,也可以用有效率。这主要不是统计学问题,但确实需要将临床思维和对数据的理解巧妙结合起来。统计学意义已经被证实,因此可认为存在这种效应。必须判断出所见的这一差异在临床上是否有用。这一判断通常是根据安全性情况通过受益/风险评价而做出的。
3.1 三个组的试验:试验产品、参照品和安慰剂
这种试验设计可以直接证明试验产品和活性对照均优于安慰剂。因此,没有必要指定一个Δ值以确定试验药有效,但在解释试验数据时应当说明以下几点。
和安慰剂对照的优效性试验一样,试验产品必须证明在统计学意义上优于安慰剂。试验产品与安慰剂差异的95%可信区间的下限必须大于0。
在这一阶段,参照组的表现不是主要的考虑对象,但如果试验产品和参照产品均未能显示在统计学意义上优于安慰剂,可能提示试验不灵敏或者缺乏检测灵敏度。
和优效性试验一样,然后要用临床判断来评价所观察到的与安慰剂的差异是
否具有临床意义。如果有参照组,可有助于做出这一判断。如果参照产品是经批准的药物,并且已知在这种类型的试验中通常可以得到具有临床意义的效果,那么这一试验中所见的参照品与安慰剂之间的差异有助于评价安慰剂与试验产品之间差异的临床意义。例如,如果试验中试验组的表现优于参照组,则假定试验产品的受益具有临床意义是合理的。
如果参照品未能证明在统计学意义上优于安慰剂,或者其表现与我们根据经验作出的预测有很大不同,那么应当对试验中参照产品的表现提出疑问。此时参照组的结果不能作为参照,试验药的任何阳性结果都是单方面的。要对参照治疗中意料之外的结果的原因进行讨论。
3.2 两个组的试验:试验产品和对照产品
由于这种类型的试验没有安慰剂组,必须通过以往参照产品与安慰剂相比较的研究来与安慰剂进行间接比较,以确定产品有效。这样做本身有一定难度,并且必须要指定非劣效性界值。但95%可信区间的下限仍可用于确定疗效优于安慰剂。如果实际没有使用安慰剂,则常常用“假定的安慰剂”这一术语。
应当进行系统性综述以找出在所考虑的条件下参照治疗和安慰剂进行比较相关的研究。这些研究可用于估计在目标患者人群中参照产品和安慰剂之间的差异。如果不能估计这一差异,或者在有足够把握度的试验中不能一致证明对照药优于安慰剂时,则使用这一对照药进行非劣效性研究的灵敏度可能会
受到质疑,只有试验产品优于对照药(活性药或安慰剂)的结果才能解释。如果参照产品是某一类药物之一,其中每种产品的疗效和安全性都相等,那么也可以使用整类药物与安慰剂的差异作为疗效参比。
申请者需要就有关文献检索方面的问题进行讨论(详细讨论见ICH E10):
1.选择偏倚。现有研究的选择标准应记录完整,以尽量表明对研究的选择没有偏倚。
2.一定时间内试验设计和临床实践的恒定性。由于临床实践可能发生了变化,或者测量参照产品效果的标准或方法作了修改,某些研究可能会毫无意义。当前试验的设计中应当考虑和以往的试验进行比较,看看是否有可能会影响治疗结果的变化。例如入选标准、诊断方法、允许的合并治疗、参照产品的给药方案、测定的终点、评价的时间等。当前试验的设计应当尽可能与以往设计良好的对参照产品与安慰剂进行比较的试验密切匹配相当。如果试验设计有不可避免的差异,那么其意义应当认真考虑,这有可能无法制定非劣效性界值。
3.一定时间内效果的恒定性。应当考虑一定时间内所见治疗差异的变化。例如在某些情况下,可能由于医疗水平总体改善,事件发生率随时间延长而降低。在这种情况下,计算时只能采用比较近期的研究。如果不能确保近期的
试验与当前试验效果的恒定性,那么选择非劣效性界值时应当保守一些。
4.发表偏倚。这种情况可能指“正面”结果的研究比那些令人失望的结果更有可能被发表。如果有可能存在这种发表偏倚,那么在得出参照产品与安慰剂相比的历史可信区间时应当保守一些。
如果有好的历史数据,则有几种方法可以用于得出非劣效性界值。所有方法的共同点是力求将历史数据中的效果变异或大小与当前试验所预期的结果结合起来。所有方法的共同点还有使用历史数据内在的一些缺点。
用“历史的”可信区间对参照产品和安慰剂进行比较(r减p)。计划中的试验产品与参照产品相比较的试验也会得出一个可信区间(t减r)。如果这些区间结合起来,则可以获得试验产品与安慰剂相比较的间接可信区间(t减p)。Δ可定义为t减r的下限,以确保t减p的间接可信区间的下限大于0。由于比较是间接的,比较明智的做法是保守一些,并选择比这一间接计算提示的数值小的一些值。
在申报的材料中,申请者应当给出直接的可信区间T减R以及间接可信区间T减P。
一旦有统计学意义的疗效已经明确,应当考虑其临床意义。应当注明由t减p
间接可信区间得出的点估计值,并考虑这一差异有临床意义。
与3个组的试验一样,参照组可以提供一定的背景参考。如果试验产品的表现比参照品好,这一定程度上证明了差异有临床意义。但如果分析时,数据表明试验中参照组的表现有疑问,则所选的非劣效性界值似乎不妥,试验的有效性值得怀疑。没有安慰剂组时,则难以验证参照治疗的表现,这时候需要历史资料以表明试验中的表现与预期一致。
要说明所观察到的差异是否在临床上有益处,应当参考相同治疗领域中观察到结果有临床意义的其他试验,还要参考结果无临床意义的试验,这同样非常重要。
3.3 不能肯定优于安慰剂的情况
在某些疾病领域,安慰剂对照试验可能不符合伦理学要求,并且目前也没有合适的对照药可证明其与安慰剂相比有可靠的疗效。例如一些肿瘤性疾病和一些“孤儿适应证”。在这些情况下,很难采用上面所列出的方法来指定Δ,但仍应当尽最大努力使用参照品的各种数据以得出新产品相对于安慰剂的间接可信区间,参照品可看作安慰剂,可以通过直接证明优于参照品来确定其疗效。
这些情况下建立的间接可信区间可能无法证明优于安慰剂,但在这种情况下
不一定要排除正面的看法。采用3.2节的方法得出的Δ不能被丢弃,因为这个值表示间接优于安慰剂。使用这个值意味着所做出的各种决定(不论正面还是负面),都承认要证实疗效数据有局限性,即我们不能保证试验治疗优于安慰剂。指定一个随意可得到的Δ值,用这个值说明非劣效性,这不是好的做法。这种方法将导致我们对产品疗效有信心的错误印象。决策所凭借的依据,无论强弱,都必须明确,这一点非常重要。
同样,可能有些情况下按照前面的章节的指南会导致Δ值很小,样本量切实可行的试验中不能排除这种情况。同样,简单确定一个较大的Δ,然后说有非劣效性,这也不是好的做法。相反,应当承认未能证明其优于安慰剂。在有些领域,决定是根据较少量数据做出的,没有证明疗效明确,但重要的是每个人一定要认识到正在做什么,是在完全清楚所担风险的情况下做出的决定。
4.确定与活性对照药相比可接受的疗效
确定新的活性化合物在安慰剂对照试验中成功是必要的,但往往还不够。试验品与参照品之间的比较本身常常有重要意义。
从这一角度来说,在开始试验之前一定要确定目的。非劣效性试验的设计和分析应当反映试验要解决的问题。进行这样一个试验有许多不同的原因,开展试验的目的会影响Δ的选择。如果试验的目的不是要说明优于参照品,则
一般被称为非劣效性试验。但“证明非劣效性”作为一个试验的目的不够详细。如果列出更精确的目的,试验目的会更加清楚。
如果唯一目的是要说明间接优于安慰剂,则应当注明这一点,可采用第3节所描述的方法选择Δ。
试验目的也可以是提供数据,来说明试验产品代替参照产品时疗效无显著降低。这很可能是非劣效性试验最常见的目的。对这个目的来说,Δ的选择不能仅看以往对照品与安慰剂相比较的试验而得出。以活性对照品与安慰剂之间预期差异的百分率选作Δ,一直提倡这样的想法,但这作为这种选择的理由不能接受。形成这些想法,主要是为确保参照产品优于安慰剂,但这已经在本文件的第3节做了说明。为妥善选择Δ,必须做出明智的决定,要得到证据的支持,即在特定疾病领域无重要差异的证据。
如果所考虑的疾病已经有许多可相互替代的治疗,一种可能的方法是考虑所有这些治疗中得到的信息。从中可以制定一个Δ,这个Δ总结了有关这些产品相对疗效的已知信息,对新试验的设计可用于提供类似水平的新产品相对疗效的知识。如果市面上目前只有一个产品,那么不能使用这种方法。此时,考虑在批准上市后不得不说服哪些人用这种产品,一种方法可能是要对开业医生进行调查,了解他们认为无关紧要的差异有多大范围,并根据对他们回答的概括统计来选择Δ。任何这种调查的表述方式都不能让回答者有偏性,
有倾向指定较大的数值。
如果预期试验产品的安全性优于参照产品,这种情况下有理由选择较大的Δ值,由于安全性方面的受益作为补偿,疗效稍微降低是可以接受的,但最好是仍然能证明疗效优于安慰剂。这些情况下,指定复合主要终点可能有用,一个终点是证明安全性终点的优效性,另一个终点是证明疗效终点的非劣效性。需要这样考虑的其他情况包括给药途径更方便、剂量更方便、次要疗效终点更优等。
本节只讨论非劣效性试验的一些目的以及选择Δ的一些方法。要点是试验的目的必须精确界定。之后,要根据精确的目的当选择Δ,并得到证据的支持。这一证据不仅仅是来自以往对照品与安慰剂相比的试验。当然最后的选择一定是至少与第3节考虑所推导出的值一样小。试验的结论不应是“非劣效性”被证实,而应当是反映试验目的的一些更精确的内容。
如果试验中活性对照品的表现与事先的预期有很大差异,那么可能难以解释试验品和参照品之间差异的意义,事先设定的Δ可能不再恰当。这种情况下,就不能从试验中得出正面的结论。包括有安慰剂的三个组的试验可以一定程度上避免这一问题,因为试验中可以直接估计活性对照品与安慰剂相比的相对疗效。
5. 难以证明有合理大小的非劣效性界值的情况
如果所考虑的治疗是用于预防死亡或不可逆性疾病,并且没有第2次治疗的机会,那么就很难说明多大的非劣效性界值为好。可以接受的额外死亡的讨论在伦理上很难接受。但拒绝所有的非劣效性界值的选择并不符合公共卫生的最大利益。除非已经发现不同治疗组间有统计学意义上的显著差异,否则差异的可信区间不仅说明试验产品有可能不如参照品,而且也表明试验品有可能优于参照品。因此即使我们认为我们不准备接受任何程度的非劣效性,但通过继续使用目前批准的产品我们正在接受一定程度的非劣效性。因此在这些领域内仍然可能进行非劣效性试验,这一点很重要。本节讨论对此有所帮助的一些方法。
5.1使用升高显著性水平的优效性
如1.4节所提到的,不允许非劣效性界值(Δ=0,基本上是优效性试验),则相同疗效的产品不能得出正面的试验数据,除非是偶然的情况。即使是有较小优势但临床上有用的产品也只能在大量试验中共同证明其益处。
目前仅针对主要疗效终点,在这种特定情况下,开展非劣效性研究而不是设计优于参照品的优效性试验,有3个主要原因。
1.产品真正等效,非劣效性试验是唯一的选择。
2.试验产品优势小,需要非常大规模的试验才能检测出,这样做是不切实际的。
3.产品有劣势,但劣势小于所提出的非劣效性界值。
显然,对于公共卫生而言,重要的是属于第2类的产品能够通过所设定的试验比不能通过的情况要多。但在这些极端的情况下如果第3类的产品不成功则更好。从公共卫生的角度来说,第1类的产品成功与否不那么重要。
这让我们得出结论,在这些重要的领域,0点错误一侧的点估计几乎不能接受。这些数据在第3类产品比在第2类更常见。
这里将非劣效性界值与显著性检验的观点并列可能有所帮助。如果95%可信区间完全大于0,我们可以在5%的显著性水平上确定优效性。对于我们95%可信区间下限中的每个特定值,一定概率下存在另一个可信区间,对于相同的数据下限正好为0。例如对于85%可信区间下限(按定义,比95%区间窄)接近0的数据集,95%可信区间可能接近-5。如果Δ指定为-5,那么在这一例子中获得非劣效性所对应的是在15%显著性水平上证明了优效性。因此我们可以在一个不是很严格的显著性水平上平行开展非劣效性试验和优效性试验。
在极端的情况下,也可以用不如p=0.05那么严格的显著性水平来进行优效性试验,但应权衡增加假阳性结果的风险与拒绝一种有价值的有疗效优势的药物的风险。指定一个我们证明一种药物的优效性所需要的可信区间水平,比指定没有临床意义的额外死亡病例数更容易接受,从伦理学角度也更容易接受。
我们知道某个Δ值暗含在增加的α水平中,这种方法并不意味着所有可能的非劣效性都被除外了。但一定要记住虽然95%可信区间和5%显著性水平是普遍接受的标准,但即使采用这一显著性水平仍有假阳性结果的可能。这里我们只是增加了假阳性优效性主张的机会,减少了假阴性的机会,注意在极端的情况下两者之间很难取得最佳的平衡。
如果使用这一方法,试验的目的和假设应当事先明确说明。如果假设是试验产品有优势,应当指出这个优势。结果支持一个事先指定的合理假设,这样的试验比那些结果出其不意的试验更有说服力。
看到研究结果未能在常规水平上达到显著性,这个时候再回过头来改用这种方法,这是不能接受的。使用这种增加显著性水平的计划和依据应当在研究方案中说明。
如果要用这种方法,则强烈建议应当就CHMP是否会认为所研究的特定情况
适合用这种方法寻求科学建议或方案辅导。
5.2在另一方面有优势的产品
某些情况下,如果产品在另一个重要的方面有优点,则有可能确定疗效的非劣效性界值。如果是这种情况,则治疗间差异的点估计值在0的错误一侧是可以接受的。这种情况下,建议设立2个主要终点,试验的目的是表明疗效的非劣效性和其他重要因素的优越性。
6.结论
l 非劣效性界值的选择要综合考虑统计学推理和临床判断。
l 包含试验产品、参照品和安慰剂的三个组的试验可以在本试验内部对非劣效性界值的选择进行一定的验证,因此困难较少。这是推荐的设计,应尽可能采用。
l 恰当选择界值要保证试验药优于安慰剂有临床意义。界值选择的这一方面在第3节讨论。
l 通常非劣效性试验主要焦点是试验产品与参照产品的相对疗效,不但但是要证明试验产品有效。这些情况下,恰当选择界值除了说明产品有效以外,还能保证试验产品不会比参照产品差很多,这样得出的非劣效性界值比较严谨。
备注
界值选择的这一方面在第4节讨论。
l 对于大多数非劣效性试验,必须证实所选界值同时满足第3节和第4节的要求。应当在研究方案中说明非劣效性界值的选择是合理的,解释中应当解决这两节中考虑的问题。
l 不可能在任何情况下都进行非劣效性试验。决定进行非劣效性试验从治疗领域和参照产品特点方面考虑,应当合情合理。
l 如果产品在其他一些方面有优势,那么可以为疗效选择一个比较宽的非劣效性界值,但这一界值不应当宽到让人对产品优于安慰剂产生怀疑。
l 某些极端情况下,可以在指定显著性水平大于0.05的情况下开展优效性试验,来代替指定非劣效性界值。