カイ二乗検定の実例 独立性の検定 r×s分割表
実際の調査データを使ってカイ二乗検定をやってみます。
カイ二乗検定は、グループ間における比率の偏り(関連)を検証する場合に用いられ、独立性の検定と適合度の検定があります。
■独立性の検定
グループと回答比率との独立性(関係性)の有無を検証。例えば、性別や年齢別に選択肢の比率に偏り(関連)があるかどうかを判断する場合。
■適合度の検定
母集団の比率と調査結果のそれとの偏りの有無を検証。
いずれも、有意水準に比べ有意確率が、低ければ何らかの偏り(関連)があると判断し、高ければ偏り(関連)はないと判断します。
検定そのものの考え方は「『検定』について考える」を参照してください。
計算についてはExcelを使用しました。
独立性の検定:r×s分割表
グループ数やカテゴリー数のいずれかあるいはどちらも3つ以上の場合、「r×s分割表」の算出方法を用いてカイ二乗検定を行うことができます。
例えば、次のようなクロス集計表の場合を検定してみましょう。
この表は、昨年に比べての暮らし向きについて雇用条件別にみた回答比率です。
グラフで確認すると、「苦しくなった」割合は、正規労働者(33.5%)よりも非正規労働者(41.3%)の方が高くなっています。
では、実際に雇用条件別で比率に偏りがあると言えるのか、カイ二乗検定をしてみましょう。
対立仮説は「雇用条件別に比率の偏りがある」、帰無仮説は「雇用条件別に比率の偏りはない」、有意水準は5%(0.05)とします。
カイ二乗検定は、比率ではなく実数を使って計算します。
下表は上表の比率を実数にしたものです。
r×s分割表のカイ二乗値を求める数式と、数式に代入する実数値の対応は次のとおりです。
各グループの横計(例えば、「f1・」「f2・」「fr・」)や各カテゴリーの縦計(例えば、「f・1」「f・2」「f・s」)のことを周辺度数(marginal frequency)と呼びます。
「セル値の二乗 ÷ 対応セルの周辺度数の積」をセルごとに計算します。
今回の検定するクロス集計は、「グループ数2 × カテゴリー数3」の計6セル分の分数計算があるということになります。
数式に当てはめて計算した結果は次のとおりです。
有意確率の計算
算出したカイ二乗値と自由度からExcel関数の「CHISQ.DIST.RT(カイ二乗値, 自由度)」を使って有意確率(p値)を求めます。
自由度は「(グループ数-1)×(カテゴリー数-1)」で求めるので、今回のケースでは(2-1)×(3-1)=2です。
Excelで「=CHISQ.DIST.RT(6.8549, 2)」と入力すると、「0.03」(小数第三位を四捨五入)という結果が返ってきました。
有意確率(p値)は0.03であり有意水準0.05を下回っているため、帰無仮説は棄却されます。
つまり、「雇用条件別に偏り(関連)がある」ということが検証されました。
レポーティングはどう書く?
最後に、今回の検定結果を調査報告書や論文に書く場合の記述例を参考までに記しておきます。
雇用条件別に暮らし向きについて有意水準5%でカイ二乗検定を行ったところ、関連が認められた(χ2(2, N = 530) = 6.85, p = .03)。したがって、雇用条件によって暮らし向きに違いがあると言える。
ちなみに、カッコの中の「2」は自由度、「N=」はサンプル数†1です。
SBクリエイティブ
売り上げランキング: 560
Notes
- サンプル数の表記は省略してもOK ↩
Only Japanese comments permit.
TrackBack URL