Matemātikā un statistikā Spīrmena ranga korelācijas koeficients ir korelācijas mērs, kas nosaukts tā radītāja Čārlza Spīrmena vārdā. Īsumā to raksta kā grieķu burtu rho ( ρ {\displaystyle \rho }{\displaystyle \rho } ) vai dažreiz kā r s {\displaystyle r_{s}}}. {\displaystyle r_{s}} Tas ir skaitlis, kas parāda, cik cieši saistītas ir divas datu kopas, ja datus var sakārtot (rankot), piemēram, no augstākā uz zemāko. Atšķirībā no Pīrsona koeficienta, Spīrmena koeficients mēra monotonu saistību (vai lielāka vērtība parasti pavisam kopā ar lielāku vērtību, un otrādi), nevis obligāti lineāru sakarību. To parasti izmanto, ja dati nav normāli sadalīti vai satur ārkārtas vērtības (outlier).

Kā aprēķina

Vispārējā formula r s {\displaystyle r_{s}}{\displaystyle r_{s}} ir ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}}}. {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

  • Soli pa solim: vispirms katrai no abām datu kopām piešķir rangu (1 — zemākais, n — augstākais). Ja ir vienādi (tie) vērtējumi, tiem piešķir vidējo rangu.
  • Aprēķina katram novērojumam rangus x_i un y_i un šo rangu starpību d_i = x_i − y_i.
  • Aprēķina d_i^2 un summē: Σ d_i^2.
  • Ievieto Σ d_i^2 un datu skaitu n formulā ρ = 1 − (6 Σ d_i^2) / (n (n^2 − 1)).
  • Ja nav vai ir maz saišu (ties), var arī vienkārši aprēķināt Pīrsona korelācijas koeficientu starp rangiem — rezultāts būs vienāds ar Spīrmena koeficientu.

Piemērs

Piemēram, ja jūsu rīcībā ir dati par to, cik dārgi ir dažādi datori, un dati par to, cik ātri ir datori, jūs varat pārbaudīt, vai tie ir saistīti un cik cieši tie ir saistīti, izmantojot r s {\displaystyle r_{s}}. {\displaystyle r_{s}}

Pieņemsim piecu datoru piemēru (vienkāršībai):

  • Dators A — cena 500, ātrums 2.5
  • Dators B — cena 700, ātrums 3.0
  • Dators C — cena 400, ātrums 2.0
  • Dators D — cena 900, ātrums 3.5
  • Dators E — cena 600, ātrums 2.8

Piešķiram rangus cenām (1 = zemākā cena): C=1, A=2, E=3, B=4, D=5. Rangus ātrumam (1 = lēnākais): C=1, A=2, E=3, B=4, D=5. Tātad rangi abām kolonnām sakrīt, d_i = 0 visiem novērojumiem, Σ d_i^2 = 0, un pēc formulas ρ = 1 − 0 = 1 — pilnīga pozitīva monotona saistība.

Ja rangos būtu atšķirības, aprēķinātu d_i^2 un ievietotu formulā, iegūstot ρ vērtību starp −1 (pilnīga negatīva monotona saistība) un +1 (pilnīga pozitīva monotona saistība). Vērtība ap 0 norāda uz vāju vai nekādu monotonu sakarību.

Praktiskas piezīmes

  • Rangu piešķiršana: ja ir vienādas vērtības (ties), piešķir to vidējo rangu. Piemēram, ja divām novērojumu ir 2. un 3. vieta, abām piešķir rangu 2.5.
  • Alternatīva formula un programmatūra: daudzi statistikas rīki aprēķina Spīrmena koeficientu, ņemot vērā korekcijas piesaistēm (ties) vai izmantojot Pīrsona korelāciju uz rangiem — tas dod to pašu rezultātu bez sarežģītas tie-korekcijas, ja korekcija nav nepieciešama.
  • Nozīmīgums: lai pārbaudītu, vai novērotā ρ ir statistiski nozīmīga, izmanto p-vērtību, kas atkarīga no n. Mazākiem paraugiem var prasīt eksaktu testu; lielākiem paraugiem bieži izmanto aproksimācijas (t-testam līdzīgas formulas).
  • Izmantošana: Spīrmena koeficients ir noderīgs, ja dati nav lineāri, satur ārkārtas vērtības vai neatbilst Pīrsona pieņēmumiem. Tas mēra monotonu sakarību, tātad attiecības, kur viena mainīgā pieaugot, otra konsekventi pieaug vai samazinās, bet ne obligāti proporcionāli.

Kopsavilkumā, Spīrmena ranga korelācijas koeficients ir vienkāršs un robusts rīks, lai novērtētu saistības spēku un virzienu starp divām sakārtojamām datu kopām. Tā interpretācija ir tieša: ρ = 1 (pilnīga pozitīva monotona saistība), ρ = −1 (pilnīga negatīva monotona saistība), ρ ≈ 0 (nav monotonas saistības).