Standartkļūda ir statistiskā lieluma izlases sadalījuma standartnovirze. Šo terminu lieto gan, runājot par to, cik lielas svārstības sagaidāmas starp dažādām izlases vērtībām, gan arī, lai apzīmētu šo standartnovirzes novērtējumu (aproksimāciju), kas aprēķināts no konkrētas izlases. Standartkļūda raksturo, cik tālu vidēji var atrasties izlases statiskais rādītājs (piemēram, vidējā vērtība) no patiesās populācijas vērtības.
Parasti vidējais lielums, ko iegūst no kādas grupas daļas (izlases), tiek lietots, lai novērtētu atbilstošo lielumu visā grupā (populācijā). Pilnīgas populācijas mērīšana bieži vien ir praktiski neiespējama vai pārāk dārga, tāpēc tiek izmantotas izlases. Taču katra izlase dod nedaudz atšķirīgu vidējo rādītāju. Vidējās vērtības standartkļūda (angliski standard error, SE) parāda, cik tuvu, vidēji ņemot, izlases vidējā vērtība būs populācijas vidējai vērtībai. Citiem vārdiem — tā mēra pārliecības līmeni par izlases rādītāja precizitāti.
Aprēķins un biežākās formulas
Ja populācijas standartnovirze σ ir zināma, standartkļūda vidējam (x̄) tiek aprēķināta kā:
SE(x̄) = σ / √n, kur n ir izlases lielums.
Praksē parasti populācijas σ nav zināma, tāpēc izmanto izlases standartnovirzi s. Tad lieto formulu:
SE(x̄) = s / √n.
Standartkļūda proporcionēm (piemēram, ja interesē daļa ar īpašu īpašību) tiek aprēķināta kā:
SE(p̂) = √[ p̂ (1 − p̂) / n ], kur p̂ ir izlases proporcija.
Standartkļūda samazinās ar izlases lielumu proporcionāli 1/√n — tas nozīmē, ka, lai dubultotu precizitāti (samazinātu SE divreiz), nepieciešams četrkāršot izlasi.
Praktisks piemērs
Ja izlasei n = 25 ir vidējā vērtība x̄ = 50 un izlases standartnovirze s = 10, tad
SE(x̄) = 10 / √25 = 10 / 5 = 2.
Aptuvenais 95% ticamības intervāls populācijas vidējai vērtībai ir x̄ ± 1.96·SE = 50 ± 3.92, t.i., (46.08, 53.92). (Ja n ir mazs un σ nav zināma, jārēķinās ar t‑sadali, nevis tieši ar 1.96.)
Nozīme statistikā
- Konfidences intervāli: SE ir pamatelements, lai veidotu ticamības intervālus ap rādītāju — tie parāda, cik plašs varētu būt intervāls, kurā atrodas populācijas parametrs.
- Hipotēžu testi: SE lieto, lai standartizētu novērojumus (piem., aprēķinot z‑ vai t‑statistiku) un pārbaudītu hipotēzes par atšķirībām vai nulles vērtībām.
- Salīdzināšana starp grupām: SE nepieciešams, lai novērtētu, vai novērotās atšķirības starp divām izlases vidējām ir statistiski nozīmīgas.
Svarīgas piezīmes un ierobežojumi
- Atšķirība no standartnovirzes: standartnovirze (σ vai s) apraksta datu izkliedi vienā izlasei, kamēr standartkļūda apraksta izkliedi no izlases statistikas (piem., vidējā) starp atkārtotām izlases ņemšanām.
- Prasības: formulas parasti pieņem, ka novērojumi ir neatkarīgi un izlase ir nejauša. Ja dati ir sakārtoti (piem., klasteri, laika rindas), vienkārša SE formula var dot maldinošus rezultātus.
- Neliels izlases lielums: ja n ir mazs un populācijas izplatība nav tuvu normālai, jāizmanto t‑sadale vai pieskaitāmas metodes (piem., bootstrap), lai novērtētu kļūdu drošāk.
- Alternatīvas pieejas: ja pieņēmumi nav pamatoti, var izmantot atkārtotu paraugu ņemšanu (bootstrap) SE novērtēšanai vai sarežģītākas formulas korekcijām (piem., svariem, klasteru korekcijām).
Apzīmējumi
Standartkļūda bieži apzīmēta kā SE(x̄), σ_{x̄} vai vienkārši SE. Sapratne par SE un tās ierobežojumiem palīdz pareizi interpretēt statistiskos rezultātus un izvairīties no pārlieku drošiem secinājumiem no ierobežotas izlases.



.jpg)