スピアマンの順位相関係数

スピアマンの順位相関係数(Spearman’s rank correlation coefficient)とは、2つの量的変数間の単調な関係性の強さを数値で表す統計指標です。ピアソンの積率相関係数とは異なり、変数間の関係が線形であることを仮定しません。

スピアマンの順位相関係数の特徴

  • 順位データに基づく: 元のデータではなく、各変数の順位に基づいて相関係数を計算します。
  • 非線形な関係に対応: 変数間の関係が単調増加または単調減少であれば、線形に限らず相関を評価できます。
  • 外れ値に強い: 順位を用いるため、外れ値の影響を受けにくいです。
  • ノンパラメトリック: データの分布に関する仮定を必要としません。

スピアマンの順位相関係数の計算方法

  1. 順位付け: 各変数について、データの順位を決定します。同順位がある場合は、平均順位を割り当てます。
  2. 順位の差: 各データ点について、2つの変数の順位の差(d)を計算します。
  3. 相関係数の算出: 以下の式を用いて、スピアマンの順位相関係数(ρ)を算出します。
ρ = 1 - (6 * Σd^2) / (n * (n^2 - 1))

ここで、

  • Σd^2: 順位の差の二乗和
  • n: データ点の数

スピアマンの順位相関係数の解釈

スピアマンの順位相関係数の値は、-1から+1までの範囲を取り、以下のように解釈されます。

  • +1: 完全に正の単調な関係があることを示します。一方の変数が増加すると、もう一方の変数も必ず増加する傾向があります。
  • 0: 単調な関係がないことを示します。2つの変数は互いに独立していると考えられます。
  • -1: 完全に負の単調な関係があることを示します。一方の変数が増加すると、もう一方の変数は必ず減少する傾向があります。
  • 0に近い値: 2つの変数にはほとんど単調な相関がないといえます。
  • ±0.2~0.4程度: 弱い単調な相関関係があるといえます。
  • ±0.4~0.7程度: 中程度の単調な相関関係があるといえます。
  • ±0.7以上: 強い単調な相関関係があるといえます。

スピアマンの順位相関係数の注意点

  • 単調な関係のみを評価: スピアマンの順位相関係数は、あくまで単調な関係のみを評価します。変数間の関係が複雑な場合、相関係数が低くても実際には強い関係がある可能性があります。
  • 因果関係を示すものではない: スピアマンの順位相関係数は、2つの変数間の関係の強さを示すものであり、因果関係を示すものではありません。相関関係があっても、一方が他方の原因であるとは限りません。

スピアマンの順位相関係数は、2つの量的変数間の単調な関係性を評価するための有用な指標です。変数間の関係が非線形である場合や、外れ値の影響を受けやすい場合に適しています。

関連用語

深層学習 | 今更聞けないIT用語集
自然言語処理 | 今更聞けないIT用語集
AIソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

クラウドネイティブ技術とアジャイル手法を駆使し、市場投入スピード(Time-to-Market)を最大化。「進化し続けるアプリケーション」を開発します。初期リリースを最速化し、拡張性と柔軟性を備えた、ビジネスの成長に追従できるアプリケーションを開発します。

DX・AI戦略支援

「何から手を付けるべきか分からない」「AIを導入したいが、費用対効果が見えない」といった経営課題に対し、技術とビジネスの両面から解を導き出します。 絵に描いた餅で終わる戦略ではなく、エンジニアリングの実装能力に基づいた、「実現可能で、勝てる技術戦略」を策定します。


リファクタリング・リアーキテクチャ

「システムが古くて改修できない」「障害が頻発する」といった技術的負債を解消します。既存資産の徹底的な診断に基づき、コードのクリーン化(リファクタリング)や、クラウドへの移行(リアーキテクチャ)を行い、システムの寿命を延ばしコストを最適化します。