Normālais (Gausa) sadalījums — definīcija, zvana līkne un piemēri
Normālais sadalījums ir varbūtības sadalījums. To sauc arī par Gausa sadalījumu, jo to atklāja Karls Frīdrihs Gauss. Normālais sadalījums ir nepārtraukts varbūtības sadalījums, un tas ir viens no visbiežāk lietotajiem sadalījumiem statistikā un daudzās lietišķajās zinātnēs. Tas ir vispārināma forma — viena sadalījumu saime, kurā konkrēts sadalījums tiek noteikts pēc tā atrašanās vietas un mēroga parametriem. Sadalījuma vidējais (μ) nosaka tās centru, bet standarta novirze (σ) nosaka izkliedi vai mērogu; varianss (dispersija, σ²) ir novirzes kvadrāts (dispersiju bieži apzīmē ar σ²).
Formulas un galvenās īpašības
Bezzīmju formālā blīvuma funkcija (PDF) normālajam sadalījumam ar vidējo μ un standarta novirzi σ ir:
f(x) = (1 / (σ √(2π))) · exp(−(x − μ)² / (2σ²)).
- Sadalījums ir simetrisks ap vidējo μ — vidējais, mediāna un moda sakrīt.
- Sadalījumu nosaka divi parametri: μ (vidējais) un σ (standarta novirze). Dispersija ir σ².
- Blīvuma līkne ir gluda, zvana veida — bezasīmptotiski tuvojas x assi.
- Inflekcijas punkti (kur līkne maina izliekumu) atrodas pie x = μ ± σ.
- Empīriskais noteikums (aptuveni): apmēram 68% datu atrodas intervālā μ ± σ, ~95% intervālā μ ± 2σ, un ~99.7% intervālā μ ± 3σ.
Standarta normālais sadalījums un Z-scores
Standarta normālais sadalījums (pazīstams arī kā Z sadalījums) ir normālais sadalījums ar vidējo vērtību nulle un dispersiju viens (attēlos tas bieži attēlots zaļā līkne). To parasti apzīmē ar Z, un tā blīvuma grafiks izskatās kā zvans — tāpēc to dēvē arī par zvana līkni. Lai pārvērstu jebkuru normālu mainīgo X ar parametriem μ un σ par standartizētu Z izmanto formulu:
Z = (X − μ) / σ.
Standartizācija ļauj salīdzināt dažādas mērvienības un izmantot standarta normālās sadalījuma tabulas vai funkcijas, lai atrastu varbūtības un kvantīļus.
Centrālā robežas teorēma un nozīme praksē
Daudzas novērotās summas vai vidējās vērtības seko normālam sadalījumam pateicoties centrālajai robežas teorēmai: ja mainīgais ir daudzu neatkarīgu, līdzīgu nejaušu ietekmju summa, tad, pie lielā skaita ietekmju, sadalījums tuvojas normālam, neatkarīgi no katra ietekmju sākotnējā sadalījuma.
Tāpēc normālais sadalījums ir īpaši svarīgs piemēram, paraugu vidējo analīzē, kļūdu modelēšanā, mērapjomu kļūdu izplatībā, testu rezultātos un daudzos citos gadījumos.
Praktiski piemēri
- Fiziskas īpašības, piemēram, pieaugušo cilvēku augums vai svars, bieži aptuveni seko normālajam sadalījumam.
- Laboratorijas mērījumu kļūdas ir bieži modeli, kas atbilst Gaussam — mazas nejaušas kļūdas apkopošanā dod aptuveni normālu izkliedi.
- Akadēmisko testu rezultātu sadalījumi dažkārt tuvinās normālam sadalījumam, it īpaši, ja rezultāti ir summas no daudziem neatkarīgiem uzdevumiem.
- Piemērs ar aprēķinu: ja pieaugušo vīriešu auguma X vidējais μ = 170 cm un σ = 10 cm, tad aptuveni 68% vīriešu būs augumā starp 160 cm un 180 cm (μ ± σ). Ja eksāmena rezultātu vidējais ir 75 punkti ar σ = 8, tad var aprēķināt varbūtību iegūt vairāk nekā 90 punktiem: Z = (90 − 75) / 8 = 1.875; atbilstošā vienpusējā varbūtība ir aptuveni 0.03 (apm. 3%).
Kā pārbaudīt normalitāti
Ne vienmēr dati ir normāli sadalīti. Pirms lietot metodes, kas pieņem normalitāti (piem., parametriski testi), ieteicams to pārbaudīt, izmantojot:
- Grafiskus rīkus: histogrammas, Q–Q grafikus.
- Statistiskus testus: Shapiro–Wilk, Kolmogorov–Smirnov, Anderson–Darling u.c.
- Piemērošanas prakses apsvērumi: lielos paraugos centrālā robežas teorēma bieži pietiekami labi attaisno normālu tuvinājumu paraugu vidējiem.
Kad normālais sadalījums neder
Normālais modelis nav piemērots, ja dati ir ļoti asimetriski, satur smagas astes vai ir ierobežoti (piem., nenegatīvi dati, procenti). Šādos gadījumos var apsvērt citus sadalījumus (lognormālo, eksponenciālo, gamma, t-sadalījumu u.c.) vai izmantot transformatūras un nepārparametriskās metodes.
Secinājums: normālais (Gausa) sadalījums ir fundamentāla statistikas sastāvdaļa — to viegli interpretēt, to var standartizēt ar Z-vērtībām, un tas parādās daudzos reālajos procesos. Tomēr katrā analīzē jāpārliecinās, vai normāla pieņēmums ir pamatots vai vai nav nepieciešama alternatīva pieeja.
Jautājumi un atbildes
J: Kas ir normālais sadalījums?
A: Normālais sadalījums ir varbūtības sadalījums, kas ir ļoti svarīgs daudzās zinātnes jomās.
J: Kas atklāja normālo sadalījumu?
A: Normālo sadalījumu pirmais atklāja Karls Frīdrihs Gauss.
J: Ko apzīmē normālā sadalījuma atrašanās vietas un mēroga parametri?
A: Izplatījuma vidējais ("vidējais") raksturo tā atrašanās vietu, bet standartnovirze ("mainība") raksturo normālā sadalījuma mērogu.
J: Kā tiek attēloti normālo sadalījumu atrašanās vietas un mēroga parametri?
A: Normālo sadalījumu vidējo vērtību un standartnovirzi apzīmē attiecīgi ar simboliem μ un σ.
J: Kas ir standarta normālais sadalījums?
A: Standarta normālais sadalījums (pazīstams arī kā Z sadalījums) ir normālais sadalījums ar vidējo vērtību nulle un standartnovirzi viens.
J: Kāpēc standarta normālo sadalījumu bieži sauc par zvanu līkni?
A: Standarta normālo sadalījumu bieži sauc par zvanu līkni, jo tā varbūtības blīvuma grafiks izskatās kā zvans.
J: Kāpēc daudzas vērtības atbilst normālajam sadalījumam?
A: Daudzām vērtībām ir normāls sadalījums, jo pastāv centrālās robežas teorēma, kas saka, ka, ja notikums ir vienādu, bet nejaušu notikumu summa, tad tas sadalās normāli.