药群论坛

标题: 小胖学统计043:ICH E9临床试验的统计学指导原则解析(62-64) [打印本页]

作者: xiaoxiao    时间: 2014-12-13 06:08 PM
标题: 小胖学统计043:ICH E9临床试验的统计学指导原则解析(62-64)
静远学堂—跟着小胖学统计043:ICH E9临床试验的统计学指导原则解析(六十二)2014-12-09 jeeyor [url=]驭时临床试验信息[/url]
# S- Y$ s% z6 P. k7 w: E4 q. U
; H$ L# u) I7 y# Y
                               
登录/注册后可看大图

; V8 K! I( z  p  p8 K, w
信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号,查看静远学堂系列栏目。1 I% h9 \% @' x& x1 p9 m; R6 N

, _0 s. x. u/ r; G$ w0 f
临床试验中常见的统计分析方法(十一)

& }' F# F5 W+ K$ b& `& _2 \- H5 |
重复测量数据分析(三)

4 B. l: V% V- e
2.The ‘Multivariate’approach:
        前边提到的’univariate’approach对重复测量的数据有个假设就是重复测量的数据间的关系是相同的,这就是我们所说的compound symmetry。但在我们的临床试验中,往往会违背这个假设,特别是当临床试验的时间特别长或各个测量的时间点的间隔不相同时,这是因为间隔时间长的两个点的测量值之间的关系往往不如间隔时间短的两个点的测量值之间的关系紧密。这时在违背compound symmetry的情况下,再使用’univariate’approach就可能会出现一些错误。
% \; g7 w9 s/ y+ U; ^
        这时我们就引入了’Multivariate’approach,它可以较好地克服上边出现的问题。与 ‘univariate’approach不同的是,’Multivariate’approach把重复测量值当作多个反应变量来处理,这也就是这个方法名字中’Multivariate’的含义,这样在违背compound symmetry的情况下,这个方法也显得更稳健(robust)。

( T2 `1 r4 ], o7 Q5 e' ]8 c  B
       下面我们来看一下怎么通过SAS程序来实现吧:
首先,我们看一下’Multivariate’approach的基本数据格式,与’univariate’approach要求一个反应变量的数据格式不同,’Multivariate’approach要求把重复测量值当作多个反应变量的数据格式,即:
病人
GROUP
组别
TREAT
时间点1
RESPONSE1
时间点2
RESPONSE2
时间点3
RESPONSE3
001
A
100
123
145
002
B
102
136
150
003
B
103
145
167
004
A
104
130
146
SAS程序:
PROC  GLM;
CLASS  GROUP;
MODEL  RESPONSE1  RESPONSE2  RESPONSE3 = GROUP /SS3;
REPEATED  TIME  PROFILE/PRINTE SUMMARY;
RUN;
7 b# Z! }/ S) t" i) |# g: L# c
程序解释:
(1)MODEL语句中把每个时间点的测量值都当作独立的变量,即RESPONSE1  RESPONSE2  RESPONSE3
(2)REPEATED语句则表明这些独立变量是重复测量值,而TIME只是你给起的一个重复因子的名字
(3)REPEATED语句中的PROFILE选项,则用来比较先后两个时间点,此处就是比较时间点2与时间点1,时间点3与时间点2;这对于确定疗效是否随着时间的变化而变化显得十分有用。例如,一项过抗组胺药治疗过敏性鼻炎试验中,分别在0周,1周,2周,3周测量症状评分,我们就可以通过这个选项来比较1周与0周,2周与1周,3周与2周的评分值,来看是不是治疗时间越长疗效越好。
(4)如果上边的REPEATED语句改成:
        REPEATED  TIME  CONTRAST(1) / PRINTE  SUMMARY;
CONTRAST(1)表示以第一个时间点为参照,后面的时间点都与第一个时间点比较;如果第一个时间点是基线值的话,这种比较就十分有用,它可以表明与基线相比是否有变化,也就是可以确定治疗是否有效。同样地例如,一项过抗组胺药治疗过敏性鼻炎试验中,分别在0周(基线),1周,2周,3周测量症状评分,我们就可以通过这个选项来比较1周与0周,2周与0周,3周与0周的评分值,如果都有统计学差别,那就可以说明治疗可以改善过敏性鼻炎的症状,是有效的。

& }: j0 N% m. V
(5)REPEATED语句中的PRINTE选项,用来通过sphericity test 来检验compound symmetry的。如果此检验无统计学意义,则说明没有违背compound symmetry。此时我们就可以也应该使用所前边提及的’univariate’approach。这里需要说明的一点是,在compound symmetry满足的情况下,’Multivariate’ approach得出的结果比’univariate’approach保守,尤其是当样本量较少时。

6 W2 M+ e3 Q( v' {7 m& q) z! \! v6 W
# F5 p9 M$ A$ H; ]
9 n$ J8 O, X5 ^' M) e: C

. U; }2 \* w) ^/ ?" l
作者: xiaoxiao    时间: 2014-12-13 06:08 PM
静远学堂—跟着小胖学统计044:ICH E9临床试验的统计学指导原则解析(六十三)、(六十四)2014-12-11 jeeyor [url=]驭时临床试验信息[/url]$ n; y$ h7 c8 f7 b

& \  q$ d9 W& U  H: Q5 W                               
登录/注册后可看大图

7 U4 u0 c) S5 W6 ]0 T4 d2 c$ D3 w7 F* W
信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号,查看静远学堂系列栏目。
+ P, n: |; E% ?: k+ l7 p+ W

临床试验中常见的统计分析方法(十二)

重复测量数据分析(四)

3 w# u% M* Z& L

前面我们介绍了两种重复测量数据分析的方法,即univariate approcah和multivariate approach,都是通过SAS程序中的GLM来实现的。

- Q* G  N' w, z

然而,临床试验中常会出现一些缺失值,这时这两种方法的使用就会出现一些问题。一般情况下,如果缺失值较多,这两种方法就会不推荐使用。为什么呢?

1 ~8 P* o0 }, o2 x1 h! R1 ]

我们拿有两个时间点的数据为例,通俗点讲一下:

病人

时间点1

时间点2

001

100

002

102

136

003

145

004

104

130

上表中001和003病人两个时间点有一个时间点数据缺失,那么:

对between-patient variability的贡献:

001病人为时间点1的数据信息

003病人为时间点2的数据信息

而对于within-patient variability来说,由于是病人自己之间的比较,001和003两个时间点缺失一个,则无法计算这个variability,因此对within-patient variability的贡献为0,而这个within-patient variability恰恰反应的就是病人的response profile,通俗来讲就是不同时间的反应的情况。因此,如果缺失值较多,导致很多病人无法纳入within-patient variability的计算,那么对于response profile的评价就会出现问题。


" l& V6 g5 H8 v7 W. I3 C; G

另外特别对于multivariate approach来说,每个病人只要有一个测量数据缺失,就会导致大量的数据被排除在分析之外,这样不仅会大大降低统计检验的power,而且还可能把那些有价值的信息排除在分析之外。

( T$ {3 _$ h; N

因此,当存在较多缺失值时,这两种方法就不是很合适了,这时我们就需要用到另外两种方法即SAS程序里的PROC MIXED和GEE(PROC GENMOD)方法了。

在下面的博文中,小胖将陆续简单介绍PROC MIXED和GEE(PROC GENMOD)两种方法。

临床试验中常见的统计分析方法(十三)

重复测量数据分析(五)

; ^2 _+ o3 f. e- T+ _9 X" {

3. PROC MIXED (Mixed Model混合效应模型)

我们先来理解一下Mixed Model (混合效应模型),小胖在先前的博文中就曾提及过固定效应(fixed effect)和随机效应(random effect)。 我们通常把某个因素对结果变量的影响称为这个变量的效应。而这种效应分为固定效应和随机效应。当这个变量水平是事先确定的,是个固定的常数时,那么它的效应就是固定效应;例如治疗组,我们这个试验就想研究A组和B组,那么水平只有A和B两个水平,因此组别就是个固定效应。

8 ^& Y; ~, R! m( T! z7 u

而当这个变量具有随机的特点时,比如它的变量水平数是无限的或不确定的,我们试验中纳入的只是这些水平数的一个随机样本时,它的效应就是随机效应。比如病人这个效应吧,我们试验中纳入的病人是从病人总体中随机抽取出来的,是个随机样本,因此病人这个效应就是个随机效应。

' M3 Q" u9 W' Z( u

那如果一个模型里既有固定效应,又有随机效应,那么这样的模型就是混合效应模型。

% C" H; U# R: g2 U. C4 |! k

其实重复测量数据分析就是一个混合效应模型,为什么呢?

(1)我们纳入模型的治疗组别一般是固定效应

(2)我们纳入模型的病人效应一般是随机效应

混合效应模型现在已被广泛应用于重复测量数据的分析,那么混合效应模型在处理重复测量数据方面有什么优势呢?


- O7 @7 [$ b& V2 `3 p; I' Q9 x

(1)混合效应模型适用于有一定数量缺失值的数据。如果一个测量值缺失了,不会对这个病人其他的测量值产生影响。这样就充分利用了有缺失值的病人的数据,而不会像univariate和mulvariate方法那样,一个观察值缺失,整个受试者的数据均作为缺失。


# F/ ]0 @+ L( k

(2)混合效应模型允许每个病人测量次数不同和观测时间不同。比如说,一个病人在第4个月进行了测量,而另一个病人在第6个月进行了测量,这时我们只需要在时间(time)变量上记录下一个是4个月,另一个是6个月就可以了。


; D: |5 p* V( i5 h( C

(3)混合效应模型不对compound symmetry做要求。你可以让模型选择自己的协方差结构(covariance structure)也可以自己指定一个协方差结构(covariance structure),关于协方差结构,小胖将在下篇博文中作一简单介绍。


* A4 M3 @( @7 ^# G

下篇博文,小胖将结合SAS中的PROC MIXED程序对混合效应模型在重复测量数据中的应用做进一步介绍。

静注:处理重复测量资料时,数据特点往往都是混合效应的(固定效应与随机效应),而且临床数据伴随缺失的情况也是很普遍的,所以为了使模型更稳健、效能更高、拟合更优,分析时尽可能直接选择MIXED过程或下一篇博文提到的GENMOD过程进行处理;就像做方差分析时选择ANOVA(要求均衡)还是GLM(无均衡要求)的问题一样,为了避免后面出现的一些不必要的麻烦,若非特殊情况都尽可能选择更少限定使用条件的分析过程。

. r* u) [" Z/ k% B$ r! U

4 i+ C! I( F; g9 e- j* U9 |% k

0 q" }4 d0 {4 t' G9 h  m+ }# Z8 @, x9 L- m( @: W3 |





欢迎光临 药群论坛 (http://www.yaoqun.net/) Powered by Discuz! X3.2