Effect size是一種量化兩個或多個變數間關係的測度。在許多臨床試驗裡面都需要這個數據。不同的研究設計需要不同種類的Effect size,其中又以Cohen's d統計量最為流行,因為他是專門用在下面這三種的研究:(1)兩個獨立群組的試後比較; (2)一個群組內的試前試後比較; (3)兩個獨立群組的試前試後差異比較。由於SAS沒有內建任何的程序來計算Effect size,所以通常需要去找線上的計算器或者自己用Excel試算表去計算。但其實Cohen's d的公式相當簡單,裡面只有用到三種元素:各組樣本,各組平均數,各組標準差。所以我在算Cohen's d時都是自己先用PROC MEANS去算出那三個元素,然後再用PROC IML去算。2012年的SESUG發表了一篇技術文件,由兩個南佛大的人公布了一個計算Cohen's d的SAS巨集程式。
這個巨集程式名為%effect_size,其共同使用下面這幾個參數:
- data: SAS資料名
- idvar: ID變數名
- groupvar: 群組變數名(必須先定義為1, 2)。若只有一組,則留空白
- timevar: 時間變數名(例如:visit=1是試前, visit=2是試後),若無則留空白
- respvars: 受測的反應變數(必須是連續型數值變數),如果有多個則用空白分開
- timevar1: 時間變數中代表"試前"的數字
- timevar2: 時間變數中代表"試後"的數字
- cl: 信賴區間%,若是要計算95%CI,則填入0.95
有一個選擇性的參數為:
所使用的部分資料如下:
- design: 用於單一群組試前試後比較。1表示使用
所使用的部分資料如下:
其中,ID是受測者的編號,GROUP=1是實驗組,GROUP=2是對照組,VISIT=1是試前,VISIT=2是試後,而PCL, BSI, TRGI是三種不同的實驗反應變數。
設計一:獨立兩群組試後比較
若只單純比較兩組的試後反應變數差異,則其Cohen's d可從下面這個公式計算出來:
其中分子是兩組的平均差,分母是兩組混合後的標準差,公式如下:
Cohen's d的信賴區間公式如下:
其中,Cohen's d統計量的標準差公式為:
程式範例如下:
設計二:單一群組試前試後比較
設計二的Cohen's d公式與設計一相同,但分子變成是試後平均和試前平均的差異,分母的混合標準差變成:
至於95%CI計算時需要用到的Cohen's d統計量的標準差則是:
其中r12是試前與試後的相關係數。不過在使用這個巨集程式時,則多了一個design參數來讓使用者選擇要(1)直接用原始數據來算混合標準差或者是(2)用試後減掉試前的差異來算混合標準差。程式範例如下:
設計三:獨立兩群組試前試後差異比較
此設計的Cohen's d公式如下:
同樣在這個設計下可以選用原始數據來算混合標準差(design=1)或者是用試後減掉試前的差異來算混合標準差(design=2)。
原文僅以設計二跑了一次範例資料,結果如下:
%effect_size的原始程式可詳見原文的p7-p11。
Contact Information
Rajendra Kadel, Ph. D. Candidate of Biostatistics
University of South Florida
College of Public Health
13201 Bruce B Downs, MDC56 Tampa, Florida 33612
rkadel@health.usf.edu
Kevin E. Kip, Ph.D., FAHA
Professor and Executive Director, Research Center,
University of South Florida
College of Nursing
12901 Bruce B. Downs Blvd. Tampa, FL 33612-4476
kkip@health.usf.edu
沒有留言:
張貼留言
要問問題的人請在文章下方的intensedebate欄位留言,請勿使用blogger預設的意見表單。今後用blogger意見表單留言的人我就不回應了。