R 初級講座ネタ検討(2元表の解析) (On progress)
#2×2表の解析
#########独立性のカイ2乗検定#########
binom.test(512,1897)
attr(,"conf.level")
Ctable <- matrix(c(512,1385,567,2419),nr=2)
chisq.test(Ctable)
library(MASS)
Ctable <- xtabs(~Sex+W.Hnd, data=survey)
Ctable
chisq.test(Ctable)
#独立性のカイ2乗検定の注意
#①カイ2乗検定を通じて言えるのは、カテゴリカル変数の関連のみ。
#因果関係を示しているわけではない
#②カイ2乗に対する近似を良くするための連続性の補正を行っているが、
#データが少ない場合はそれでもカイ2乗での近似はあまりよくない。
#########フィッシャーの直接確率法#########
#表の合計欄の数値が決まっている -> 超幾何分布モデル
#紅茶を入れる際にミルクを先に入れたものと紅茶を先に入れたもの
#では味に違いがあるという主張(対立仮説)を検証する。
#ミルクを先に入れた場合と紅茶を先に入れた場合、それぞれ4杯を用意。
#実験参加者には4杯ずつであることを伝え、4杯ミルクを先に入れたカップを
#選んで貰う。超幾何分布モデルを使用。
table <- matrix(c(3,1,1,3),nr=2)
fisher.test(table, alternative = "greater")
#########関連性の指標#########
#独立性のカイ2乗やフィッシャーの直接確率法は2×2表が独立で
#あるかを調べる検定法。もし、2×2表が独立でない場合には、
#どの程度の関係があるのかを見ることが必要。
library(MASS)
Ctable <- xtabs(~ Sex + W.Hnd, data = survey)
library(vcd)
assocstats(Ctable) #φ係数, ピアソンの一致数係数、クラメルのV統計量を計算
oddsratio(Ctable, log = FALSE) #log = FALSEを付けないと対数oddsになる
oddsratio(Ctable)
#2×J表の解析
#########独立性のカイ2乗検定#########
#2×2表の考え方を拡張可能