Ticamības intervāls: definīcija, piemēri un aprēķins statistikā
Uzzini, kas ir ticamības intervāls: definīcija, 95% piemēri un praktiski aprēķini statistikā — soli pa solim skaidrojums un ilustrēti piemēri studentiem un pētniekiem.
Statistikā ticamības intervāls ir viena no parametra novērtēšanas formām, kas vienas punktveida aplēses vietā sniedz intervālu ar robežām, kurās, ar noteiktu varbūtību, atrodas populācijas (nezināmais) parametrs. Šo varbūtību sauc par ticamības līmeni — to bieži norāda procentos, piemēram, "95 % ticamības intervāls". Intervāla galapunktus sauc par ticamības robežām. Tā kā ticamības intervāls ir balstīts uz izlases datiem, tas mainās no izlases uz izlasi: konkrētai procedūrai un datiem, jo augstāks ir ticamības līmenis, jo plašāks parasti būs intervāls.
Lai aprēķinātu ticamības intervālu, parasti nepieciešami pieņēmumi par aplēšu procesa būtību — tā galvenokārt ir parametriska metode. Viens no izplatītākajiem pieņēmumiem ir, ka populācijas, no kuras ņemta izlase, sadalījums ir normāls. Tā rezultātā klasiskie ticamības intervāli nav īpaši robusti pret šiem pieņēmumiem, taču ir pieejamas modifikācijas un neparametriskās metodes, kas palielina uzticamību, ja pieņēmumi neturas.
Interpretācija
- Frekventista interpretācija: 95 % ticamības intervāls nozīmē, ka, ja mēs atkārtotu izlases ņemšanu un aprēķinātu intervālu tādā pašā veidā ļoti daudzas reizes, apmēram 95 % no iegūtajiem intervāliem saturētu patieso (bet nezināmo) parametra vērtību.
- Neskaidrības padoms: Nav pareizi teikt, ka "ir 95 % varbūtība, ka šis konkrētais intervāls satur parametru" frekventistu skatījumā — šī varbūtība attiecas uz procedūras ilgtermiņa uzvedību, nevis uz konkrētu vienu intervālu. (Bayes pieeja ļauj tieši interpretēt intervālu kā varbūtības sadalījumu, bet tas prasa pirmszināšanu.)
Kā aprēķina — pamatformulas
Biežākās situācijas un formulas (divpusējie 1 − α cipari):
- Ticamības intervāls populācijas vidējam, ja σ (populācijas standartnovirze) ir zināma:
CI = x̄ ± z_{1−α/2} * (σ / √n), kur x̄ — izlases vidējais, z_{1−α/2} — standarta normālā sadalījuma kritiskais koeficients (piem., 1.96 priekš 95 %), n — izlases lielums. - Ticamības intervāls populācijas vidējam, ja σ nav zināma (izmanto t sadalījumu):
CI = x̄ ± t_{1−α/2, n−1} * (s / √n), kur s — izlases standartnovirze, t_{1−α/2, n−1} — Student t kritiskais skaitlis ar n−1 brīvības pakāpēm. - Ticamības intervāls proporcijai (binārs rezultāts):
CI = p̂ ± z_{1−α/2} * sqrt( p̂(1−p̂) / n ), kur p̂ — izlases proporcija. Ir arī citas precīzākas metodes (Wilson, Agresti–Coull), it īpaši, ja p̂ ir tuvu 0 vai 1 vai n ir mazs. - Mērogs (margin of error):
Robežu attālums no punktveida aplēses = kritiskais koeficients × standarta kļūda. Lai sasniegtu noteiktu kļūdas robežu E, var aprēķināt nepieciešamo izlases lielumu: n ≈ (z_{1−α/2} * σ / E)^2 (pie zināmas σ).
Piemēri
- Vidējais ar zināmu σ: ja x̄ = 100, σ = 15, n = 36 un vēlamies 95 % CI, z = 1.96, tad margin = 1.96*(15/√36)=1.96*2.5=4.9. CI = 100 ± 4.9 = (95.1, 104.9).
- Vidējais ar nezināmu σ: ja x̄ = 50, s = 8, n = 10 un 95 % CI, t_{0.975,9} ≈ 2.262, margin = 2.262*(8/√10) ≈ 5.72. CI ≈ (44.28, 55.72).
- Proporcija: ja p̂ = 0.6, n = 200 un 95 % CI, SE = sqrt(0.6*0.4/200) ≈ 0.0346, margin = 1.96*0.0346 ≈ 0.0679. CI ≈ (0.532, 0.668).
Viensienas un divpusējie intervāli
Ticamības intervālus var veidot kā divpusējus (abas puses) vai vienpusējus (piem., tikai augšējā robeža). Vienpusēja 95 % intervāla augšējā robeža atbilst z_{0.95}, nevis z_{0.975}.
Pieņēmumi un ierobežojumi
- Normalitāte: klasiskās formulas pieprasa normalitāti vai, izmantojot centrālo robežu teorēmu (CRT), pietiekami lielu n, lai izlases vidējais būtu aptuveni normāls.
- Neatkarība: izlases novērojumiem jābūt neatkarīgiem (vai jāņem vērā atkarība, piemēram, laika rindas vai klasterēta izlase).
- Robustums: ja datu sadalījums ir ļoti izliektāks vai satur izteiktus ārprātus, parastie CI var būt maldinoši — jāapsver transformācijas (piem., log) vai robustas metodes.
Neparametriskas un bootstrap metodes
Ja pieņēmumi neturas vai grib precīzāk novērtēt intervāla sadalījumu, var izmantot bootstrap:
- Atkārtota izlases ņemšana ar atgriešanos no sākotnējiem datiem, izrēķinot punktveida aplēsi katrā replikātā.
- No replikātu aplēsēm veidojam intervālu, piemēram, percentile (π/2 un 1−π/2), vai izmantojam BCa (bias-corrected and accelerated) metodi, kas bieži dod labākas īpašības nelielos paraugos vai nenormālos datos.
Saistība ar hipotēžu testiem
Ticamības intervāls ir cieši saistīts ar hipotēžu testiem: ja nulles hipotēzē norādītā vērtība (piem., μ0) neatrodas (1−α) CI, tad nulles hipotēze parasti tiek atmesta pie līmeņa α divpusējā testā. Tādēļ CI sniedz vairāk informācijas par efektu (robežas) nekā tikai p vērtība.
Prakse un ziņošana
- Vienmēr norādi ticamības līmeni (piem., 95 %) un lietoto metodi (piem., t-intervāls, Wilson CI vai bootstrap BCa).
- Ziņo punktveida aplēsi, intervālu un izlases lielumu (x̄, CI, n), kā arī, ja nepieciešams, pieņēmumus par sadalījumu vai σ.
- Interpretējot, skaidri atzīmē frekventistu ierobežojumus un, ja izmanto Bayes pieeju, norādi priora izvēli.
Biežas kļūdas un uzvedības viltības
- Nepareiza interpretācija kā "95 % varbūtība, ka parametrs atrodas šajā intervālā" bez paskaidrojuma par metodi.
- Nelaba prakse izmantot parastos CI, ja dati satur būtiskus novirzienus vai ir maza izlase — labāk izmantot robustas vai neparametriskas metodes.
- Neskaidra ziņošana bez ticamības līmeņa vai metodes apraksta.
Kopumā ticamības intervāls ir spēcīgs instruments, lai parādītu aplēses nenoteiktību un sniegtu informāciju gan par lieluma, gan precizitātes robežām. Tomēr jāievēro pieņēmumu ierobežojumi un, nepieciešamības gadījumā, jāizvēlas piemērotākas metodes (piem., t-intervali, precīzas proporciju metodes vai bootstrap), lai rezultāti būtu uzticami.
Jēdziena "confidence" nozīme
Līdzīga nozīme ir arī statistikā lietotajam jēdzienam ticamība. Vispārpieņemtajā lietojumā apgalvojums par 95 % ticamību kādam faktam parasti tiek uzskatīts par norādi uz faktisku pārliecību. Statistikā apgalvojums par 95 % ticamību vienkārši nozīmē, ka pētnieks ir redzējis vienu iespējamo intervālu no daudziem iespējamiem, no kuriem deviņpadsmit no divdesmit intervāliem satur patieso parametra vērtību.
Praktisks piemērs

Mašīna piepilda krūzītes ar margarīnu. Piemēram, mašīna ir noregulēta tā, lai tasīšu saturs būtu 250 g margarīna. Tā kā mašīna nevar piepildīt katru krūzīti ar precīzi 250 g, atsevišķās krūzītēs pievienotajam saturam ir zināmas variācijas, un to uzskata par nejaušu mainīgo X. Pieņem, ka šīs variācijas ir normāli sadalītas ap vēlamo vidējo vērtību 250 g ar 2,5 g standartnovirzi. Lai noteiktu, vai iekārta ir atbilstoši kalibrēta, nejauši izvēlas n = 25 margarīna krūzes, un tās nosver. Margarīna svars ir X1, ..., X25, izlases paraugs no X.
Lai gūtu priekšstatu par sagaidāmo μ, ir pietiekami sniegt aplēsi. Piemērotais aplēse ir izlases vidējais lielums:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}}={\bar {X}}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. }
Paraugā ir parādīti faktiskie svari x1, ...,x25 ar vidējo vērtību:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 grami . {\displaystyle {\bar {x}}={\frac {1}{25}}}sum _{i=1}^{25}x_{i}=250,2\,{\text{grams}}. }
Ja mēs ņemtu vēl vienu 25 tasīšu paraugu, mēs varētu viegli sagaidīt, ka atradīsim 250,4 vai 251,1 gramu. Tomēr parauga vidējā vērtība 280 g būtu ļoti reta, ja tasīšu vidējais saturs patiesībā ir tuvu 250 g. Ap novēroto izlases vidējo vērtību 250,2 ir vesels intervāls, kurā, ja visas populācijas vidējā vērtība patiešām ir šajā intervālā, novērotie dati netiktu uzskatīti par īpaši neparastiem. Šādu intervālu sauc par parametra μ ticamības intervālu. Kā mēs aprēķinām šādu intervālu? Intervāla galējie punkti jāaprēķina no izlases, tāpēc tie ir statistikas dati, izlases X1, ..., X25 funkcijas un līdz ar to arī nejauši lielumi.
Mūsu gadījumā mēs varam noteikt galīgos punktus, uzskatot, ka izlases vidējais X no normāli sadalītas izlases arī ir normāli sadalīts ar tādu pašu sagaidāmo μ, bet ar standartkļūdu σ/√n = 0,5 (grami). Standartizējot, mēs iegūstam nejaušo mainīgo
Z = X¯ - μ σ / n = X¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0,5}}}}
atkarīgs no novērtējamā parametra μ, bet ar standarta normālu sadalījumu, kas nav atkarīgs no parametra μ. Tādējādi ir iespējams atrast no μ neatkarīgus skaitļus -z un z, kur Z atrodas starp tiem ar varbūtību 1 - α, kas ir mērs tam, cik pārliecināti mēs vēlamies būt. Mēs pieņemam 1 - α = 0,95. Tātad mums ir:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,}
Skaitlis z izriet no kumulatīvās sadalījuma funkcijas:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}}}}
un mēs iegūstam:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X - 1,96 × 0,5 ≤ μ ≤ ≤ X + 1,96 × 0,5 ) = P ( X - 0,98 ≤ μ ≤ ≤ X + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\skqrt {n}}}}pareizi)\\[6pt]&=P\left({\bar {X}}}-1,96\times 0,5\leq \mu \leq {\bar {X}}+1.96\reiz 0,5\pa labi)\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\pa labi).\end{aligned}}}}
To var interpretēt šādi: ar varbūtību 0,95 mēs atradīsim ticamības intervālu, kurā starp stohastiskajiem galapunktiem būs parametrs μ.
X - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,}
un
X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,}
Tas nenozīmē, ka pastāv 0,95 % varbūtība, ka parametrs μ tiks sasniegts aprēķinātajā intervālā. Katru reizi atkārtojot mērījumus, tiks iegūta cita izlases vidējā X vērtība. 95 % gadījumu μ atradīsies starp beigu punktiem, kas aprēķināti no šī vidējā lieluma, bet 5 % gadījumu tas tā nebūs. Faktisko ticamības intervālu aprēķina, formulā ievadot izmērītos lielumus. Mūsu 0,95 ticamības intervāls ir šāds:
( x - 0,98 ; x - + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
Tā kā vēlamā μ vērtība 250 ir iegūtā ticamības intervāla robežās, nav iemesla uzskatīt, ka iekārta ir nepareizi kalibrēta.
Aprēķinātajam intervālam ir fiksēti galapunkti, starp kuriem μ var atrasties (vai arī ne). Tādējādi šim notikumam ir varbūtība 0 vai 1. Mēs nevaram teikt: "ar varbūtību (1 - α) parametrs μ atrodas ticamības intervālā". Mēs tikai zinām, ka atkārtojot 100(1 - α) % gadījumu μ atradīsies aprēķinātajā intervālā. Tomēr 100α % gadījumu tas tā nav. Un diemžēl mēs nezinām, kuros gadījumos tas notiek. Tāpēc mēs sakām: "ar ticamības līmeni 100(1 - α) % μ atrodas ticamības intervālā. "
Attēlā pa labi ir parādītas 50 ticamības intervāla realizācijas dotai populācijas vidējai vērtībai μ. Ja mēs nejauši izvēlamies vienu realizāciju, ir 95 % varbūtība, ka mēs esam izvēlējušies intervālu, kas satur parametru; tomēr mums var nepaveikties un mēs varam būt izvēlējušies nepareizo intervālu. Mēs to nekad neuzzināsim; mēs esam pieķērušies savam intervālam.

Vertikālie līniju segmenti ir 50 μ ticamības intervāla realizācijas.
Jautājumi un atbildes
J: Kas statistikā ir ticamības intervāls?
A: Uzticamības intervāls ir īpašs intervāls, ko izmanto, lai novērtētu parametru, piemēram, populācijas vidējo lielumu, un kas vienas vērtības vietā sniedz parametra pieļaujamo vērtību diapazonu.
J: Kāpēc vienas vērtības vietā izmanto ticamības intervālu?
A: Uzticamības intervālu izmanto vienas vērtības vietā, lai ņemtu vērā nenoteiktību, novērtējot parametru, pamatojoties uz izlasi, un lai noteiktu varbūtību, ka parametra patiesā vērtība ir intervāla robežās.
J: Kas ir ticamības līmenis?
A: Uzticamības līmenis ir varbūtība, ka novērtējamais parametrs ir ticamības intervālā, un to bieži vien norāda procentos (piemēram, 95 % ticamības intervāls).
J: Kas ir ticamības robežas?
A: Uzticamības robežas ir ticamības intervāla galējie punkti, kas nosaka novērtējamā parametra pieņemamo vērtību diapazonu.
J: Kā ticamības līmenis ietekmē ticamības intervālu?
A: Konkrētajā novērtēšanas procedūrā, jo augstāks ir ticamības līmenis, jo plašāks ir ticamības intervāls.
J: Kādi pieņēmumi ir nepieciešami, lai aprēķinātu ticamības intervālu?
A: Lai aprēķinātu ticamības intervālu, parasti ir vajadzīgi pieņēmumi par aplēses procesa būtību, piemēram, pieņēmums, ka populācijas, no kuras ņemta izlase, sadalījums ir normāls.
J: Vai ticamības intervāli ir stabila statistika?
A. Apstiprinātie ticamības intervāli, kā aplūkots tālāk, nav stabila statistika, lai gan var veikt korekcijas, lai palielinātu robustumu.
Meklēt