Reporting the wilcoxon signed ranks testKen Plummer
A Wilcoxon Signed-Ranks Test was conducted to compare pre-test and post-test ranks. The results indicated that post-test ranks were statistically significantly higher than pre-test ranks, with a Z score of 21 and p value less than .027. The document provided guidance and examples for reporting the results of the Wilcoxon Signed-Ranks Test in APA style.
The document provides an example of how to report the results of a Mann-Whitney U test in APA style. It describes a study examining whether football or basketball players eat more slices of pizza. After collecting the data, a Mann-Whitney U test was conducted to account for outliers among basketball players. The summary includes reporting the median number of slices for each group, the U value, and p-value to indicate football players (median = 9) ate significantly more slices than basketball players (median = 5).
5. a. MAR
欠損の有無の確率 (R) は,欠損値を含む変数 (Y) の値とは関連せず,
他の変数 (X, Z)の値に観測値と関連する
e.g., X = 人種, Y = 英語の読解テスト
ヒスパニック系よりも白人の方が読解テストで欠損データが増加
※欠損データのメカニズムがMARであるか検定する手法はない・・・
欠損データの理論的枠組み (Rubin, 1976)
5
X
Y
Z
R
欠損データのメカニズム
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
6. b. MCAR (missing completely at random)
欠損の有無の確率 (R) は,欠損値を含む変数 (Y) や他の観測した変数
(X) の値とも関連しない。観測していない変数 (Z) と関連する。
e.g., Y =テスト成績, X = 学習方略, Z = 風邪等の予定外の出来事
欠損データが生じる確率は,テスト成績や学習方略と関係しない
※欠損の有群と無群のYの比較により,MCARであるか確認可能
欠損データの理論的枠組み (Rubin, 1976)
Reporting
Guideline
(Kelly & Maxwll)
6
X
Y
Z
R
欠損データのメカニズム
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
7. a. MNAR (missing not at random)
欠損の有無の確率 (R) は,観測した他の変数 (X) の値を統制しても,
欠損値を含む変数 (Y) の値と関連する。
e.g., X = IQ, Y = 読解テスト
読解スキルが低いとテストで解答できない項目が増加し,結果的
にテスト成績も低くなる
※MARと同様,MNARであることを確かめる方法は基本的にない。
※測定していない第3の変数がYとRに影響している可能性もあり。
※MNARに対応した欠損値処理は,Enders (2010)を参照
欠損データの理論的枠組み (Rubin, 1976)
Reporting
Guideline
(Kelly & Maxwll)
7
X
Y
Z
R
欠損データのメカニズム
強い関連にある(e.g., r = .40以上)だと
問題になってくる (Collins, Schafer, & Kam, 2001)
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
8. Rubin (1976)の欠損データ理論
a. Missing At Random (MAR)
b. Missing Completely At Random (MCAR)
c. Missing Not At Random (MNAR)
欠損データのメカニズムの比較
Reporting
Guideline
(Kelly & Maxwll)
8
IQ Complete MCAR MAR MNAR
78 9 - - 9
84 13 13 - 13
84 10 - - 10
85 8 8 - -
87 7 7 - -
91 7 7 7 -
92 9 9 9 9
94 9 9 9 9
94 11 11 11 11
96 7 - 7 -
99 7 7 7 -
105 10 10 10 10
105 15 15 15 15
108 10 10 10 10
112 10 - 10 10
113 12 12 12 12
115 14 14 14 14
118 16 16 16 16
134 12 - 12 12
Job Performance ratings
Enders (2010) のTable 1.2.
X
Y
Z
R
X
Y
Z
R
X
Y
Z
R
MAR MCAR MNAR
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
9. a. 平均値のポジティブバイアスを修正できる
b. 欠損データの分布のパラメタではなく,本質的なパラメタを正確に推定す
るために必要する状況を分類したことが,Rubin (1976)の重要な点
c. MARやMCARであれば,欠損データの配置は関係なく対処可能である。
d. MNARは,データの欠損と関連のありそうなデータを収集することで,
MARとすることが可能
e. MNARにおけるSchafer & Graham (2002)の薦め
• 次の測定に備えて,回答者にドロップアウトなどのデータの欠損と関
連しそうなものを尋ねる調査項目を用いること
• MNARの状況をMARにできるよう,研究をデザインしましょう!
• E.g., 補助変数の使用
なぜ,欠損データのメカニズムが重要なのか?
Reporting
Guideline
(Kelly & Maxwll)
欠損値の処理方法
9
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
10. a. 欠損メカニズムがMCARであることは少ないが,MCARでないことを
確認する上で,検定に価値あり
b. MCAR = 平均と共分散の等質性 (Kim & Bentler, 2002)
• 欠損のあるデータとないデータを比較(t検定,Little’s MCAR
test)
• 有意差ありなら,MAR or MNAR
• 有意差なしなら,MCAR
• グループサイズが小さいため,検定力が低い
• t 検定の場合,他の変数との相関を考慮できない
• Little’s MCAR testは t 検定の多変量版
⇒全ての変数を同時に検査,タイプⅡエラー生じやすい
c. 欠損値は少ないためグループサイズが小さくなり検定力は総じて低い
d. 平均値比較はMCARであることを保証しないということが重要
10
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
MCARかどうかを検定
11. a. 質問紙を何種類か作成し,意図的に,質問紙の一部に対して回答しない
参加者グループをつくる。
e.g., Three form design
a. 完全情報最尤推定法や多重代入法なら,不完全データを捨てることなく
分析可能
b. MCARであり検定力が低下するだけで,推定値はバイアスを受けない
11
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
MARやMCARのデータを得るためには
Planned Missing Data designs
Form X
• A尺度
• B尺度
• C尺度
• D尺度
Form A
• A尺度
• B尺度
• C尺度
Form B
• A尺度
• B尺度
• D尺度
Form C
• A尺度
• C尺度
• D尺度
12. 変数の数で割り振ることも可能
同一変数の項目を割り振ることも可能
重回帰分析では標準誤差が小さくなる
Graham (2006)では,変数ごとに割り振ることを推奨
12
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
Three Form Design
Planned Missing Data designs
X A B C
変数や項目の割り振りは均等に!
form 1
(X, B, C)
form 2
(X, A, C)
form 3
(X, A, B)
調査で用いる
全調査項目
調査用紙
の種類
13. 検討できる交互作用には限界がある
検定力の潜在的な損失がデメリット
最尤推定法を用いると検定力はそれほど大きく低下しない(.10程度↓)
に含まれる項目数を増やすことで検定力↑
13
• 資料紹介
欠損データのメカニズム
• 伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
Three Form Designによる検定力の低下の程度
Planned Missing Data designs
Set Scale Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8
X Q1 -
Q2 1.00 -
A Q3 .99 .99 -
Q4 .99 .99 .99 -
B Q5 .99 .99 .90 .90 -
Q6 .99 .99 .90 .90 .99 -
C Q7 .99 .99 .91 .91 .90 .91 -
Q8 .99 .99 .90 .91 .91 .90 .99 -
three form designによる相関係数の検定力
note. N = 300, ρ= .30で5000回のシミュレーション
Item set
X A B C
X
Form X A B C AB XB
1 ✔ ー ✔ ✔ ー ✔
2 ✔ ✔ ー ✔ ー ー
3 ✔ ✔ ✔ ー ✔ ✔
交互作用項Item sets
17. a. リストワイズ除去
b. ペアワイズ除去:相関が1を超えうる。特に多変量解析で問題
MCARを仮定,でないとデータにバイアスが生じる
MCARを満たしても,検定力は低下する
社会行動科学分野では,最も一般的で簡単にできる
American Psychological Association Task Force on Statistical
Inference (Wilkinson & Task Force on Statistical Inference,
1999)によると・・・
“The two popular methods for dealing with missing data that are
found in basic statistical packages – listwise and pairwise
deletion of missing values – are among the worst methods
available for practical applications”
17
欠損データの伝統的処理方法
Deletion Method
• 資料紹介
• 欠損データのメカニズム
伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline
18. a. 平均値代入
• 分散,共分散,相関を薄めてしまう
b. 回帰代入
• 相関やR2を過大推定してしまう
• サンプルサイズを増やすと補正により真の分布に近づく
c. Hot-deck代入
d. Averaging the available items(person mean imputation)
e. Last observation carried forward
完全データができる点で魅力的
問題点
Stochastic regressionを除いてMCARでもバイアスを受ける。
誤差を過小評価し,標準誤差を小さくする
18
欠損データの伝統的処理方法
Imputation Method
• 資料紹介
• 欠損データのメカニズム
伝統的な欠損値分析
• 完全情報最尤推定法
• 多重代入法
• Reporting Guidline