历史上第一个随机对照临床试验——研究设计和统计学考虑

肺结核在1946之前是不治之症。患了就相当于被判了死刑。历史上许多名人，如契诃夫、劳伦斯和鲁迅，都死于这种疾病。医生尝试了很多方法，但都没有找到真正有效的治疗方法。1946年，Rugers大学教授及其团队发现了第二种抗生素链霉素，并应用于临床，其抗结核作用开启了结核病治疗的新时代。

1948 Geoffrey Marshall等人在BMJ发表了链霉素治疗肺结核的临床试验，这是历史上第一个随机对照试验。本研究旨在评价链霉素治疗肺结核的疗效和安全性。入选经细菌学确诊的双侧急性进行性原发性肺结核患者，年龄15-30岁，排除陈旧性肺结核，合并空洞患者。本研究采用多中心随机空白对照设计。实验组接受链霉素治疗，卧床休息，对照组卧床休息(当时没有别的办法，只能卧床休息)。主要评价指标为6个月生存率和6个月时胸片评价的明显改善率。结果表明，实验组和对照组的6个月生存率分别为93%和73%(P

临床研究设计的基本原则是随机、对照和重复。随机性是临床试验设计的首要原则，应贯穿于研究的全过程，具体体现为每个研究对象被分配到实验组或对照组的机会相同，以保证组间的可比性。在这项研究中，随机分组信封被使用。对每一个符合入出院标准的患者，依次打开一个信封，按照里面安排的分组进行。随机信封大大方便了临床试验的操作，保证了入组前的评价是盲的，避免了分组的偏倚。如果不是，比如这个实验不是随机的，把病情严重的病人分成对照组，把病情较轻的病人分成治疗组，结果可想而知。在临床试验中，计算机程序通常用于生成随机数。随机数是均匀分布在(0，1)区间的随机变量。比如你想把24个被试按照1: 1完全随机分为实验组和对照组，可以事先规定分组规则为24，随机数中12的点数对应实验组，较大的为对照组。如果是2: 1，那么16个孩子被分到实验组，剩下的8个是对照组。另一种随机方法是限制随机或区组随机，其目的是在临床试验进展的任何时间使每组的病例数几乎相同。比如24个被试按照1: 1随机分组，分组的大小可以事先指定为4。每组中，两个小数字对应实验组，大数字对应对照组。

临床试验为什么要设计对照组？通过比较区分，设置对照，维持实验组和对照组之间的平衡，是消除混杂因素的主要手段。这是临床试验设计的第二个原则。控制可以是平行控制或交叉控制。同一临床试验可能包含一个或多个不同条件的质控品。临床试验中的对照有:1)安慰剂对照，2)空白对照，3)阳性药物对照，4)剂量反应对照和5)外部对照，6)联合应用对照组。1)安慰剂对照。安慰剂是一种虚拟药物，其剂型、大小、口感、大小、颜色、气味、味道尽可能与实验药物一致，但不含活性成分。安慰剂可以克服研究者受试者水平疗效和安全性评价者的偏倚，也可以消除疾病自然进展的影响。但使用安慰剂对照时要考虑以下问题:在伦理层面上，在所研究的药物尚未得到有效治疗的情况下，使用安慰剂对照不存在伦理问题。然而，如果已经有药物上市，使用安慰剂对照就存在伦理问题。如果明知市面上的药物有一定毒性，导致不良反应，也可以使用安慰剂。当使用安慰剂不会延缓病情时，推迟治疗是正确的选择。2)由于当时条件的限制，本研究采用空白对照。空白对照的应用如下:由于特殊的治疗方法，安慰剂盲法无法实施或难以实施。比如实验组是放疗，手术等。或者实验药物的不良反应太特殊，研究者和受试者都不能被蒙蔽。比如恒瑞的单克隆抗体PD-1，70%以上会有血管瘤，很难用安慰剂。这项研究没有使用安慰剂，是双盲的，但为了减少主观因素，两名放射科医生和一名临床医生在不知道受试者分组的情况下独立评估疗效和安全性，从而减少偏倚。3)阳性对照是指选择市场上有效的药物作为对照药物，需要疗效确认，医学界认可，并纳入药典，特别是近期纳入药典的药物。阳性药物对照组使用的剂量和给药方案必须是最佳剂量和方案。阳性药物对照试验应该是随机双盲的，双盲执行过程通常是双模拟的。比如要对比贝那曲肽和西格列汀，一个皮下注射，一个口服，需要两种安慰剂才能做到随机双盲，即双盲双模拟。4)剂量反应控制是将实验药物设计成几个剂量组，随机分成一个剂量组，这个剂量组可能包括也可能不包括安慰剂。例如，I期临床SAD和MAD研究。5)外部比较也是历史比较。当所研究的疾病严重威胁人类健康，尚无满意的治疗方法时，如艾滋病、恶性肿瘤等，可根据药物作用机制、动物实验和早期经验推荐新药，可考虑外部控制。但外对照的可比性较差，受试者并非来自同一患者群，更不用说双盲，因此应用非常有限。6)对照组联合应用。例如多个控制组；三臂测验(阳性对照、安慰剂、实验组)，常用于非劣效试验选择；负荷研究:在安慰剂对照试验中，每个受试者服用标准治疗药物，实验组服用实验药物，对照组服用安慰剂。

临床试验的第三个设计原则:重复。重复是指每个实验组要有一定数量的病例，也就是样本量。研究对象之间总是存在变异的，所以科学实验往往需要有足够的数字来提高结论的可靠性，避免偶然性，避免把个别现象当成普遍现象。根据概率论，样本量越大，从样本量计算出的频率或平均值等统计量越接近整体参数。但是样本量越大越好，因为案例多，成本高，工作量大，造成浪费。况且，如果样本量扩大100倍，标准差只会减少1/10。统计设计的任务之一是正确估计样本量。

虽然这项研究是历史上第一个随机对照研究，但即使以今天的标准来看，它的设计也是严谨的。

参考资料:

临床试验案例的统计解释