先日、公衆衛生学専攻の大学院にて無事卒業論文を書き終えて提出することができました。その中で、利用した尺度についての「クロンバックのα係数」を算出して論文にも記載することになりました。
この記事では、そもそも「信頼性とは何か」「クロンバックのα係数とは何か」「統計解析ソフトRを使ってクロンバックのα係数を簡単に計算する方法」の3点をまとめます。
クロンバックのα係数(クロンバックアルファ)とは?
「クロンバックのα係数」とは、尺度の信頼性の中でも「内的整合性」を確認するために計算するものです。
臨床心理士の試験でもよく出てきます。
「内的整合性」とは、尺度内のそれぞれの質問項目が同じ概念を測定しているか?のことです。
そもそも「信頼性(reliability)」とは何か?
信頼性とは、テストや尺度の精度のこと。どれだけ誤差が少なく計測できるかを意味します。同じ人に対して何度もテストをした時に、同じ結果になるかが大事です。
ちなみに、妥当性とはまた、「目的に合っているか」「測定したいことがちゃんと測定できているか」などを指します。信頼性が高い(=何度計測しても同じ結果になる)からといって、全く頓珍漢な概念を計測していては妥当性が低いので、その尺度は使い物にならないことになります。そのため、信頼性と妥当性が認められた尺度を研究では使います。
例えば、うつ症状を計測するPHQ-9という9つの質問で作られた尺度があります。何度回答しても同じ結果になればPHQ-9の信頼性は高いと言えます。また、設問の内容や、他のうつ症状の尺度と比較したときに、ちゃんとうつ症状の度合いを計測できているならPHQ-9の妥当性は高いと言えます。
信頼性は、「安定性」「一貫性」「等価性」の3つの要素で構成されます。
- 安定性(再現性):繰り返し測定しても同じ結果になるか?
- 一貫性(内的整合性):尺度内のそれぞれの質問項目が同じ概念を測定しているか?
- 等価性:類似した構成概念の尺度と同じ結果になるか?
安定性(再現性)とは?
安定性(再現性)とは、繰り返し測定しても同じ結果になるかどうかです。
再テスト法(再検査法)で検証できます。
等価性とは?
等価性とは、類似の検査でも同じ結果になるかどうかです。
平行検査法で検証できます。
一貫性(内的整合性)とは?
一貫性(内的整合性)とは、尺度内部の質問が、それぞれ同じ概念を測定できているかどうかです。
折半法とクロンバックのα係数で検証できます。
信頼性を推定する4つの方法
クロンバックのα係数は、信頼性の中でも一貫性を確認する方法の1つです。
心理統計の世界では、信頼性検討の方法として主に以下の4つが使われています。そのうちの1つになります。
再テスト法
同じ計測を1〜2週間ほど時間をおいて実施します。1回目の得点と2回目の得点の結果を比較して、相関係数を調べます。信頼性の中でも「安定性」を調べるために使われます。
時間を空けるので、その間に被験者の心身に変化が起こってしまう可能性や、同じ設問を回答することで設問を覚えてしまうことによる懸念があります。
毎年1回ストレスチェックの実施を義務付けられていますが、2015年の義務化から毎年受けているので受検者は設問を覚えてしまい、信頼性に影響が出ているのではないかと思います。
平行検査法
似ている概念の尺度を同時に計測して、そのテストとの相関係数を検証します。例えば、うつ症状の尺度の信頼性を調べるために、既存のうつ症状の尺度も同時に回収して相関係数を計算するなどです。
尺度の信頼性・妥当性を検証した論文では、既存の尺度との比較がよくされていますよね。これを「平行検査法」と呼びます。
折半法
1つのテストを2つに分けて2つの間の相関を信頼性係数とする方法です。テストを2つに分割するパターンが1通りのものが折半法で、可能なすべての組み合わせを検証するのが次に紹介するクロンバックのアルファ係数です。
スピアマン・ブラウンの公式というものを使って算出します。
クロンバックのアルファ係数(α係数)
2分割の可能なすべての組み合わせから信頼性係数の平均値を求める方法です。「クロンバックアルファ」などと呼ばれます。信頼性が高いと判断するためには「0.7」以上は必要といわれています。
僕は修士の卒論を書く際に、尺度の設問を一部間違ってしまったため、設問にミスはあっても内部一貫性はある程度あることを示すためにクロンバックアルファを計算しました。
クロンバックのα係数を論文で活用した事例
僕は修士論文で「クロンバックのα係数」を計算し活用しました。なぜかというと、初歩的なミスで恥ずかしいのですが尺度の設問のうち1つを間違えてしまったからです。
既に信頼性・妥当性が検証されている日本語版のACSS-FADという7つの設問の尺度を使っていました。しかし、7問中1問を間違えてしまったのです。設問のミスがあった中でも、内的整合性がちゃんとあるのかどうかを確かめるために「クロンバックのα係数」を使いました。
通常は、信頼性・妥当性が既に検証された尺度をそのまま使うことが多いので、わざわざ「クロンバックのα係数」を論文で使わないことが多いと思います。
恥ずかしながら設問を間違うという致命的なミスをしてしまい、僕は卒論で計算することになりました。
Rでのクロンバックのアルファ係数(α係数)の計算方法
Rを使うと、たった2行のコードを入力するだけで簡単にクロンバックのアルファ係数を計算することができます。
3ステップに分けて解説します。
(自分はMac OS用のRを使っています。基本的にWindowsでも同じプログラムが使えると思いますが、細かい差異がもしかしたらあるかもしれません。)
【Step.1】尺度の結果の値のみのCSVファイルを作成する
まずはGoogleスプレッドシートやExcelで、尺度の回答結果のCSVファイルを作成します。
この時、間違えないように余計なデータは含めずに、尺度の設問の結果のみの列に絞ってCSVファイルを作成することが重要です。
例えば、7つの質問の尺度であれば、7列のみのデータでCSVファイルを作成しておきます。
【Step.2】RにCSVデータをインポートする
> 任意の変数名 <- read.csv("~/Desktop/インポートするファイル名.csv")
Rを起動して、CSVファイルをインポートします。
自分はデスクトップにCSVファイルを保存して、作業ディレクトリをデスクトップにして、上記のプログラムでCSVファイルを読み込んでいます。
【Step.3】alphaでクロンバックのアルファ係数を求める
> alpha(変数名[,-1])
次に上記のプログラムを入力したら計算結果がすぐに出てきます。クロンバックのアルファ係数はやり方を覚えたらRで一瞬で計算できてしまいます。ちなみに、[,-1]は1行目を除くという意味です。
実際に僕がRでクロンバックアルファを計算した時の画面は以下のような感じ。
左上にある「0.79」が、あらゆる組み合わせで信頼性を検証した結果の平均値(=クロンバックアルファ)です。
実際に論文で使うのは、1番左上にある「0.79」の数字です。
これが2分割の可能なすべての組み合わせから信頼性係数の平均値になります。
「0.7」よりも高かったので、「ある程度の内的整合性(一貫性)があった」と言えます。
まとめ:クロンバックのα係数は一貫性の検証に使う!
クロンバックのα係数は、信頼性(安定性・等価性・一貫性)の中でも「一貫性」を検証する方法の1つです。
尺度の中で使われている設問の内部での一貫性を、あらゆるパターンで2分割して、信頼性計数を算出し平均して求めます。
Rについては、基本的にやりたい統計解析を随時ネットで調べて、実践を通して学ぶのがおすすめです。体系的に基礎から学びたい人は上記の本がわかりやすかったですが、やはり本を読んだだけだと身にならないので、手を動かしながら学ぶこと推奨です。
ジョイナーの「自殺の対人関係理論」や「身についた自殺潜在能力」、「ウェルテル効果」「パパゲーノ効果」など、自殺予防の基礎知識が非常にわかりやすく解説されていて、自殺について今わかっていることを学ぶのに末木先生の「自殺学入門」はおすすめです。
昔、臨床心理士の指定大学院への入試を検討していた際に、こちらの河合塾KALSの参考書で心理学、心理統計のキーワード学習をしていました。信頼性・妥当性についての基礎知識もわかりやすくまとまっていて、こちらのシリーズおすすめです。