Spearmanの順位相関係数(スピアマンのρ)は、2つの変数の単調関係の強さを測定するノンパラメトリック相関指標です。Pearsonの相関係数が「線形関係」のみを測るのに対し、Spearmanの順位相関は「一方が増えるともう一方も増える(または減る)」という単調関係であれば、直線的でなくても捉えることができます。
順位を使って相関を計算する仕組み
Spearmanの順位相関係数は、実際のデータ値ではなく「順位」に変換してからPearsonの相関係数を計算したものです。例えば、テストの点数と順位の関係を考えると、点数を順位に置き換えてから相関を計算します。この順位変換により、外れ値の影響が大幅に軽減されます。また、データが正規分布に従う必要もないため、歪んだ分布のデータでも安心して使えます。
Pearsonの相関係数との使い分け
Pearsonの相関係数は「線形関係」を正確に測りますが、外れ値に弱く正規分布を前提とします。一方、Spearmanの順位相関は「単調関係」を幅広く捉え、外れ値にも頑健です。データが正規分布に従い線形関係が想定される場合はPearsonを、分布に自信がない場合や外れ値が存在する場合、順序データを扱う場合はSpearmanを選びましょう。両方を計算して比較するのもよい方法です。値が大きく異なる場合は、非線形な関係や外れ値の影響が示唆されます。
Qast の EDA 機能では、Pearsonの相関係数とSpearmanの順位相関係数の両方を自動計算し、結果を比較できます。2つの値が大きく異なる場合は、変数間に非線形な関係がある可能性を示すサインとして活用できます。

