ICH E9临床试验的统计学指导原则解析(五十九)
6 E3 o% A c+ `. I8 F8 w
从临床试验实例来看样本量的计算(十四)
前边的博文,小胖主要从如何计算样本量的角度结合实例向大家介绍了样本量的确定。正如小胖在先前提到的,样本量的确定本身更像是一门艺术,相比样本量计算公式和计算过程,其前边所作的功课特别是计算所需参数的确定远远比计算本身更为重要和复杂。下边我们以effect size这个参数的确定为例,大家一起探讨一下怎么有效地和研究者一起确定临床试验的样本量。
Effect size的确定需要从研究者那里获取信息,需要研究者的大力参与。作为统计师,你的职责虽然不是直接确定这个值,但你在这个过程中可以发挥很大的作用,其中你最重要的职责便是通过你对研究设计以及样本量计算的专业知识来从研究者那里引导出effect size的信息。这怎么理解呢?
5 m+ ~' {% `, l4 B% @
在我们的临床试验实施过程中,常会碰到这样的情况,当我们问研究者effect size多少时,研究者根本不知道怎么回答,或者不知道你问的什么,甚至觉得这个问题不是他们应该回答的。特别是当我们问的问题比较专业难懂时,比如如果你问一个研究者“有90%的把握度在显著性水平为0.05(双侧)上检验出两组多大的差异才有意义?”诸如此类的很专业的问题时,研究者可能有三个反应?
4 k p _3 d4 {+ K$ u0 Q5 x
(1)“什么?你说的什么?”
(2)“你是统计师,你觉得呢?”
(3)“两组不管多少差异都有意义啊!”
结果呢?我们是什么信息也没得到。
那我们该怎么做才可能得到我们所需的信息呢?
第一步,试着这样问:
“您觉得或希望我们的药疗效能比XX药(对照药)高多少?”
这时研究者可能报出一个他期望的数值来,比如说,“我觉得你们的药应该比XX药(对照药)在收缩压上多降个10mmHg。”
这时你得到的这个数值只是研究者的期望值,往往比较高,而根据这个值计算出来的样本量往往比较少,这时你心里可能有个底了,就是基本上这个计算出来的样本量差不多就是你最少需要的样本量了。然而,事实上这个期望值往往会比最终你确定的effect size高,因为毕竟是期望值,会估得比较高。这时你可以根据这个期望值进一步问一个比期望值低的值,一般从期望值的1/2问起:
“您觉得我们的药能多降个5mmHg在临床上有意义吗?”
如果回答是没意义,那么你可以适当地提高这个值,比如说“那6mmHg呢?”依次类推。
当然这时你也可以根据不同的effect size列出不同的样本量,然后再与研究者综合判断,从而确定effect size。
这就是所谓的两步问法,这样问的好处就是循序渐进。
另外,有时问绝对值(比如上例中的5mmHg)比较难以理解,有时你还可以这样问相对值,比如:
“您觉得我们的药能比XX药在收缩压上能多降20%在临床上有意义吗?”
还有你还可以反过来问,多少值没意义,如:
“您觉得收缩压多降个多少在临床上没啥意义?”
还有你也可以让医生现身病人说法,如:
“如果您是病人的话,有一种新药收缩压能多降个5mmHg,但费用会高一点(或者还有什么别的劣势),您会用吗?”
以上小胖给大家提供了一些effect size确定过程中与研究者沟通交流的方式,当然每个人的询问和回答方式都不一样,仅供大家参考。
静注:通过研究者的估计会存在较大的不确定性和随意性,也不够严谨科学,我们通常情况下,优先通过本研究的历史资料或类似研究的参考文献进行权衡确定,这些资料当中,又以RCT作为更优先的参考,当然,要是这个研究完全找不到任何的参考资料也只能找研究者估计了,不过这种情况下研究者大多时候也根本不了解情况,这时候为控制风险还是建议申办者先做个预试验看看疗效了。
重复测量数据分析(一)
我们先来看一下下边这个例子:
J Affect Disord. 2005 Apr;85(3):259-66
Divalproex in the treatment of bipolar depression: a placebo-controlled study
这是一项随机、双盲、安慰剂对照的临床试验,受试者被随机分配到Divalproex组和placebo组。主要疗效指标是HAMD评分。试验共进行8周,每周对疗效指标进行一次测量。
组别 | 病人 | 访视时间 | |||
Week1 | Week2 | Week3 | Week4 | ||
A | 101 | 3 | 5 | 7 | 8 |
103 | 3 | 7 | 8 | 10 | |
104 | 4 | 8 | 6 | 9 | |
107 | 5 | 6 | 9 | 11 | |
B | 102 | 3 | 4 | 5 | 9 |
105 | 3 | 6 | 7 | 8 | |
106 | 5 | 6 | 4 | 7 | |
108 | 4 | 4 | 6 | 9 |
以上这个例子就是我们在临床试验中常碰到的,一个病人需要接受多次访视,每次访视都要进行相应的检测,这就是我们最常见的重复测量的例子。说白了,就是对同一个病人进行多次的测量,比如说不同的时间点进行测量,这就是重复测量。这时如果我们想知道基于这些重复测量的数据,两组疗效是否有差别时,该怎么做?比如上例中我们想知道Divalproex组和placebo组的疗效是否有差异。因此就引出了重复测量分析的概念。
我们可以简单模拟一个简单的两组重复测量的设计的测量结果的表格。
关于重复测量数据的统计分析,有多种方法,从下篇博文开始,小胖将陆续介绍几种常见的重复测量数据的统计分析方法。
p% ~6 g: I d$ e5 W( n3 g/ t
重复测量数据分析(二)
从本篇博文开始,小胖将向大家陆续介绍重复测量数据分析的常用方法。
1. The ‘univariate’approach即一般的方差分析方法
这种分析方法与我们前边提及的方差分析的思路是一致的。一般的重复测量资料我们一般会考虑到三个因素即组别、病人和测量时间。这时我们需要注意到疗效可能在不同的组别、同一个组别内的不同病人、不同的测量时间都会有不同或变异。因此,我们在建立方差分析模型时,会纳入group effect、patient(within group)effect和time effect。此外,我们还可能纳入group-by-time交互作用项。
我们来先看一下下边这个ANOVA的总结吧
SOURCE | df | SS | MS | F |
GROUP | g-1 | SSG | MSG | FG=MSG/ MSP(G) |
PATIENT(WITHIN GROUP) | N-g | SSP(G) | MSP(G) | |
TIME | t-1 | SST | MST | FT=MST/ MSE |
GROUP-BY-TIME | (g-1)(t-1) | SSGT | MSGT | FGT=MSGT/ MSE |
ERROR | (N-g) (t-1) | SSE | MSE | |
TOTAL | Nt-1 | TOT(SS) |
从上边这个表格,我们需要注意一点就是主效应的检验F值的分母用到的是PATIENT(WITHIN GROUP)对应的MSP(G),而不是误差项对应的MSE。
根据这个思路,我们先来看一下怎么通过SAS程序来实现吧:
首先,我们要对重复测量数据结构即排列方式的整理
你可能会碰到如下的数据排列方式:
病人 | 组别 | 时间点1 | 时间点2 | 时间点3 |
001 | A | 100 | 123 | 145 |
002 | B | 102 | 136 | 150 |
003 | B | 103 | 145 | 167 |
004 | A | 104 | 130 | 146 |
我们需要转化成下列的数据排列方式:
病人 Subject | 组别 Group | 时间 Time | 疗效值 Response |
001 | A | 1 | 100 |
001 | A | 2 | 123 |
001 | A | 3 | 145 |
002 | B | 1 | 102 |
002 | B | 2 | 136 |
002 | B | 3 | 150 |
003 | B | 1 | 103 |
003 | B | 2 | 145 |
003 | B | 3 | 167 |
004 | A | 1 | 104 |
004 | A | 2 | 130 |
004 | A | 3 | 146 |
SAS CODE:
PROC GLM;
CLASS GROUP SUBJECT TIME;
MODEL RESPONSE= GROUP SUBJECT(GROUP) TIME GROUP*TIME/SS3;
RANDOM SUBJECT(GROUP);
TEST H=GROUP E= SUBJECT(GROUP);
RUN;
这个程序我们需要注意两点:
(1)RANDOM SUBJECT(GROUP):这个语句用来规定SUBJECT(GROUP)是个随机效应。因为我们是从大量的合格病人人群中选择病人的,你所做的推断和结论应该是对整个人群的推断和结论,而不是你选择的这些病人,所以我们把SUBJECT(GROUP)当作随机效应来处理
(2)TEST H=GROUP E= SUBJECT(GROUP):正如前边提及的,这个语句就是用来规定对于group的检验其F值计算时的分母是SUBJECT(GROUP)。
欢迎光临 药群论坛 (http://www.yaoqun.net/) | Powered by Discuz! X3.2 |