Uzticamības intervāls

Statistikā ticamības intervāls ir īpaša noteikta parametra novērtēšanas forma. Izmantojot šo metodi, vienas vērtības vietā tiek dots vesels parametra pieļaujamo vērtību intervāls, kā arī varbūtība, ka parametra reālā (nezināmā) vērtība būs šajā intervālā. Uzticamības intervāls ir balstīts uz novērojumiem no izlases, un tāpēc tas atšķiras no izlases uz izlasi. Varbūtību, ka parametrs būs intervālā, sauc par ticamības līmeni. Ļoti bieži to norāda procentos. Uzticamības intervālu vienmēr norāda kopā ar ticamības līmeni. Var runāt par "95 % ticamības intervālu". Uzticamības intervāla galapunktus sauc par ticamības robežām. Konkrētai novērtēšanas procedūrai konkrētā situācijā, jo augstāks ir ticamības līmenis, jo plašāks ir ticamības intervāls.

Lai aprēķinātu ticamības intervālu, parasti ir vajadzīgi pieņēmumi par aplēšu procesa būtību - tā galvenokārt ir parametriska metode. Viens no izplatītākajiem pieņēmumiem ir, ka populācijas, no kuras ņemta izlase, sadalījums ir normāls. Tādējādi turpmāk aplūkotie ticamības intervāli nav robustā statistika, lai gan var veikt izmaiņas, lai palielinātu robustumu.

Jēdziena "confidence" nozīme

Līdzīga nozīme ir arī statistikā lietotajam jēdzienam ticamība. Vispārpieņemtajā lietojumā apgalvojums par 95 % ticamību kādam faktam parasti tiek uzskatīts par norādi uz faktisku pārliecību. Statistikā apgalvojums par 95 % ticamību vienkārši nozīmē, ka pētnieks ir redzējis vienu iespējamo intervālu no daudziem iespējamiem, no kuriem deviņpadsmit no divdesmit intervāliem satur patieso parametra vērtību.

Praktisks piemērs

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Mašīna piepilda krūzītes ar margarīnu. Piemēram, mašīna ir noregulēta tā, lai tasīšu saturs būtu 250 g margarīna. Tā kā mašīna nevar piepildīt katru krūzīti ar precīzi 250 g, atsevišķās krūzītēs pievienotajam saturam ir zināmas variācijas, un to uzskata par nejaušu mainīgo X. Pieņem, ka šīs variācijas ir normāli sadalītas ap vēlamo vidējo vērtību 250 g ar 2,5 g standartnovirzi. Lai noteiktu, vai iekārta ir atbilstoši kalibrēta, nejauši izvēlas n = 25 margarīna krūzes, un tās nosver. Margarīna svars ir X1, ..., X25, izlases paraugs no X.

Lai gūtu priekšstatu par sagaidāmo μ, ir pietiekami sniegt aplēsi. Piemērotais aplēse ir izlases vidējais lielums:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}}={\bar {X}}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Paraugā ir parādīti faktiskie svari x1, ...,x25 ar vidējo vērtību:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 grami . {\displaystyle {\bar {x}}={\frac {1}{25}}}sum _{i=1}^{25}x_{i}=250,2\,{\text{grams}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Ja mēs ņemtu vēl vienu 25 tasīšu paraugu, mēs varētu viegli sagaidīt, ka atradīsim 250,4 vai 251,1 gramu. Tomēr parauga vidējā vērtība 280 g būtu ļoti reta, ja tasīšu vidējais saturs patiesībā ir tuvu 250 g. Ap novēroto izlases vidējo vērtību 250,2 ir vesels intervāls, kurā, ja visas populācijas vidējā vērtība patiešām ir šajā intervālā, novērotie dati netiktu uzskatīti par īpaši neparastiem. Šādu intervālu sauc par parametra μ ticamības intervālu. Kā mēs aprēķinām šādu intervālu? Intervāla galējie punkti jāaprēķina no izlases, tāpēc tie ir statistikas dati, izlases X1, ..., X25 funkcijas un līdz ar to arī nejauši lielumi.

Mūsu gadījumā mēs varam noteikt galīgos punktus, uzskatot, ka izlases vidējais X no normāli sadalītas izlases arī ir normāli sadalīts ar tādu pašu sagaidāmo μ, bet ar standartkļūdu σ/√n = 0,5 (grami). Standartizējot, mēs iegūstam nejaušo mainīgo

Z = X¯ - μ σ / n = X¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0,5}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

atkarīgs no novērtējamā parametra μ, bet ar standarta normālu sadalījumu, kas nav atkarīgs no parametra μ. Tādējādi ir iespējams atrast no μ neatkarīgus skaitļus -z un z, kur Z atrodas starp tiem ar varbūtību 1 - α, kas ir mērs tam, cik pārliecināti mēs vēlamies būt. Mēs pieņemam 1 - α = 0,95. Tātad mums ir:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Skaitlis z izriet no kumulatīvās sadalījuma funkcijas:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

un mēs iegūstam:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X - 1,96 × 0,5 ≤ μ ≤ ≤ X + 1,96 × 0,5 ) = P ( X - 0,98 ≤ μ ≤ ≤ X + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\skqrt {n}}}}pareizi)\\[6pt]&=P\left({\bar {X}}}-1,96\times 0,5\leq \mu \leq {\bar {X}}+1.96\reiz 0,5\pa labi)\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\pa labi).\end{aligned}}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

To var interpretēt šādi: ar varbūtību 0,95 mēs atradīsim ticamības intervālu, kurā starp stohastiskajiem galapunktiem būs parametrs μ.

X - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

un

X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Tas nenozīmē, ka pastāv 0,95 % varbūtība, ka parametrs μ tiks sasniegts aprēķinātajā intervālā. Katru reizi atkārtojot mērījumus, tiks iegūta cita izlases vidējā X vērtība. 95 % gadījumu μ atradīsies starp beigu punktiem, kas aprēķināti no šī vidējā lieluma, bet 5 % gadījumu tas tā nebūs. Faktisko ticamības intervālu aprēķina, formulā ievadot izmērītos lielumus. Mūsu 0,95 ticamības intervāls ir šāds:

( x - 0,98 ; x - + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Tā kā vēlamā μ vērtība 250 ir iegūtā ticamības intervāla robežās, nav iemesla uzskatīt, ka iekārta ir nepareizi kalibrēta.

Aprēķinātajam intervālam ir fiksēti galapunkti, starp kuriem μ var atrasties (vai arī ne). Tādējādi šim notikumam ir varbūtība 0 vai 1. Mēs nevaram teikt: "ar varbūtību (1 - α) parametrs μ atrodas ticamības intervālā". Mēs tikai zinām, ka atkārtojot 100(1 - α) % gadījumu μ atradīsies aprēķinātajā intervālā. Tomēr 100α % gadījumu tas tā nav. Un diemžēl mēs nezinām, kuros gadījumos tas notiek. Tāpēc mēs sakām: "ar ticamības līmeni 100(1 - α) % μ atrodas ticamības intervālā. "

Attēlā pa labi ir parādītas 50 ticamības intervāla realizācijas dotai populācijas vidējai vērtībai μ. Ja mēs nejauši izvēlamies vienu realizāciju, ir 95 % varbūtība, ka mēs esam izvēlējušies intervālu, kas satur parametru; tomēr mums var nepaveikties un mēs varam būt izvēlējušies nepareizo intervālu. Mēs to nekad neuzzināsim; mēs esam pieķērušies savam intervālam.

Vertikālie līniju segmenti ir 50 μ ticamības intervāla realizācijas.Zoom
Vertikālie līniju segmenti ir 50 μ ticamības intervāla realizācijas.

Jautājumi un atbildes

J: Kas statistikā ir ticamības intervāls?


A: Uzticamības intervāls ir īpašs intervāls, ko izmanto, lai novērtētu parametru, piemēram, populācijas vidējo lielumu, un kas vienas vērtības vietā sniedz parametra pieļaujamo vērtību diapazonu.

J: Kāpēc vienas vērtības vietā izmanto ticamības intervālu?


A: Uzticamības intervālu izmanto vienas vērtības vietā, lai ņemtu vērā nenoteiktību, novērtējot parametru, pamatojoties uz izlasi, un lai noteiktu varbūtību, ka parametra patiesā vērtība ir intervāla robežās.

J: Kas ir ticamības līmenis?


A: Uzticamības līmenis ir varbūtība, ka novērtējamais parametrs ir ticamības intervālā, un to bieži vien norāda procentos (piemēram, 95 % ticamības intervāls).

J: Kas ir ticamības robežas?


A: Uzticamības robežas ir ticamības intervāla galējie punkti, kas nosaka novērtējamā parametra pieņemamo vērtību diapazonu.

J: Kā ticamības līmenis ietekmē ticamības intervālu?


A: Konkrētajā novērtēšanas procedūrā, jo augstāks ir ticamības līmenis, jo plašāks ir ticamības intervāls.

J: Kādi pieņēmumi ir nepieciešami, lai aprēķinātu ticamības intervālu?


A: Lai aprēķinātu ticamības intervālu, parasti ir vajadzīgi pieņēmumi par aplēses procesa būtību, piemēram, pieņēmums, ka populācijas, no kuras ņemta izlase, sadalījums ir normāls.

J: Vai ticamības intervāli ir stabila statistika?


A. Apstiprinātie ticamības intervāli, kā aplūkots tālāk, nav stabila statistika, lai gan var veikt korekcijas, lai palielinātu robustumu.

AlegsaOnline.com - 2020 / 2023 - License CC3