Histogramma: definīcija, nozīme un piemēri statistikā
Histogramma: uzzini definīciju, nozīmi un skaidrus piemērus statistikā — ātrs, vizuāls datu sadalījuma ceļvedis.
Histogramma ir statistikas jēdziens. Tā ir grafisks attēls, kas parāda, kādā veidā ir sadalīts novērojumu kopums — cik daudz paraugu nokļūst katrā vērtību intervālā vai kategorijā. Parasti histogramma tiek zīmēta kā blokus (stāvus taisnstūrus) attēlojošs grafiks, kur bloka platums atbilst intervāla (sauktam arī par "kasti" vai "binu") platumam, bet bloka augstums — frekvencei vai relatīvajai frekvencei. Vairākos gadījumos histogramma tiek veidota uz pamata, ko var iegūt no tabulas ar daudzām kategorijām: tabulā norāda, cik daudz novērojumu ir katrā kategorijā, un pēc tam šo informāciju attēlo grafa veidā.
Kas ir histogrammas galvenā jēga?
Histogrammas mērķis ir vizuāli parādīt datu sadalījumu, atklāt formas iezīmes — piemēram, vai sadalījums ir simetrisks, labēji vai kreisi novirzīts, vai tam ir viena vai vairākas pīķa zonas (modalitātes), kā arī novērot izteiktus novirzījumus (outliers). Histogramma palīdz saprast datu koncentrāciju un plūsmu, un tā bieži tiek izmantota pirms turpmākas statistiskas analīzes vai modeļu veidošanas.
Etimoloģija
Vārds histogramma ir atvasināts no grieķu valodas vārdiem histos un gramma. Histos nozīmē tīmeklis vai masts, bet gramma nozīmē zīmējums, pieraksts vai raksts. Tātad etimoloģiski histogramma ir sava veida tīkla vai mastu zīmējums — attēls, kurā redzami stabiņi, kas ilustrē datu sadalījumu.
Galvenie elementi
- Bini (intervāli): datu intervāli, kuros tiek skaitīti novērojumi. Tie var būt ar vienādu vai dažādu platumu, bet biežāk izmanto vienāda platuma binus.
- Frekvence: cik daudz novērojumu nokļūst katrā binā. Var attēlot absolūtas frekvences (skaits) vai relatīvās frekvences (daļa no kopuma).
- Platums: binu platums ietekmē histogrammas izskatu — par šauriem binēm redzēs vairāk detaļu, bet arī trokšņa; par platiem binēm var pazust svarīgas iezīmes.
- Bloka augstums vai bloka laukums: parasti bloka augstums atbilst frekvencei. Ja izmanto bloku blīvumu (density), tad bloka laukums atbilst relatīvai frekvencei un visu bloku laukumu summa var būt 1 (lai attēlotu sadalījuma blīvumu).
Kā veidot histogrammu — vienkāršs soļu apraksts
- Savāc datus un izlemt, vai dati ir diskreti vai nepārtraukti. Histogrammas galvenokārt izmanto nepārtrauktiem kvantitatīviem datiem.
- Izvēlies binu skaitu vai platumu. Daži praktiski ieteikumi: Sturges noteikums (k ≈ ⌈log2(n) + 1⌉) vai Freedman–Diaconis rīks binu platumam (h = 2·IQR·n^(−1/3)).
- Sakārto datus pēc intervāliem un saskaiti frekvences katrā binā.
- Zīmē taisnstūrus ar noteikto platumu un augstumu, kas atbilst frekvencei vai blīvumam.
- Pievieno ass nosaukumus un etiķetes, ja nepieciešams, un pārbaudi, vai binu izvēle neizkropļo datu interpretāciju.
Vienkāršs piemērs
Pieņemsim, ka mums ir 10 studentu rezultāti: 45, 57, 61, 73, 88, 92, 66, 48, 59, 77. Izvēlamies binus ar platumu 10 (40–49, 50–59, 60–69, 70–79, 80–89, 90–99). Frekvenču sadalījums būs:
- 40–49: 2 novērojumi (45, 48)
- 50–59: 2 novērojumi (57, 59)
- 60–69: 2 novērojumi (61, 66)
- 70–79: 2 novērojumi (73, 77)
- 80–89: 1 novērojums (88)
- 90–99: 1 novērojums (92)
Histogramma parādīs sešus taisnstūrus ar attiecīgiem augstumiem 2, 2, 2, 2, 1, 1. No tā var secināt, ka dati ir salīdzinoši vienmērīgi izkliedēti pa diapazonu ar dažiem augstiem rezultātiem.
Interpretācija un varianti
- Modalitāte: vienmērīga izkliedēšana (viena moda), divmodeļa vai multimodāla — histogramma to skaidri parāda.
- Novirzījums: ja pīķi ir pārvietoti uz labu vai kreiso pusi, sadalījums ir attiecīgi labēji vai kreisi novirzīts.
- Blīvuma histogramma: ja vēlaties salīdzināt sadalījumus ar dažādu novērojumu skaitu, izmanto relatīvās frekvences vai normalizētu blīvumu (lai kopsumma būtu 1).
- Kumulatīvā histogramma: parāda sakrāto frekvenci, kas ļauj vieglāk noteikt kvantīļus vai procentus zem noteiktas vērtības.
Atšķirība no stabiņu diagrammas (bar chart)
Lai gan histogramma vizuāli atgādina stabiņu diagrammu (bar chart), galvenā atšķirība ir tāda, ka histogramma attēlo sadalījumu kvantitatīviem datiem, kur x-ass atspoguļo nepārtrauktus intervālus, savukārt stabiņu diagramma parasti izmanto kategoriskiem datiem, un starp stabiņiem parasti ir atstarpe. (Piezīme: oriģinālajā tekstā jau bija saite uz grafisks attēls, tāpēc šeit tiek uzsvērta kontekstiska atšķirība.)
Priekšrocības un ierobežojumi
- Priekšrocības: vienkārši saprotama vizualizācija; labi parāda pamata iezīmes (modalitāte, novirzījums, izkliedēšanās); noderīga pirms papildu analīzes.
- Ierobežojumi: histogrammas izskats un secinājumi ir atkarīgi no binu skaita un platuma; sliktā binu izvēle var radīt maldinošu priekšstatu par datiem; histogramma nesniedz precīzas vērtības atsevišķiem novērojumiem.
Praktiski rīki
Histogrammas viegli izveidot ar statistikas programmatūru (piemēram, R, Python/Matplotlib, Excel u.c.). Daudzas programmas ļauj interaktīvi mainīt binu skaitu vai platumu, lai izvērtētu, kā tas ietekmē sadalījuma interpretāciju.
Kopsavilkumā — histogramma ir vienkāršs, bet spēcīgs rīks, lai vizualizētu kvantitatīvo datu sadalījumu, taču jābūt uzmanīgiem ar binu izvēli un interpretāciju.

100 normāli sadalītu nejaušu vērtību histogrammas piemērs
Līdzīgas idejas
Histogramma ir viens no septiņiem kvalitātes kontroles pamatinstrumentiem, kas ietver arī Pareto diagrammu, pārbaudes lapu, kontroles diagrammu, cēloņu un seku diagrammu, diagrammu un izkliedes diagrammu.
Histogrammas vispārinājums ir kodola izlīdzināšanas metodes. Tā no iesniegtajiem datiem konstruē vienmērīgu varbūtības blīvuma funkciju.
Jautājumi un atbildes
J: Kas ir histogramma?
A: Histogramma ir grafisks attēlojums, kas informē par attiecīgo paraugu sadalījumu.
Q: Kāds ir histogrammas mērķis?
A: Histogrammas mērķis ir parādīt attiecīgo paraugu sadalījumu.
J: Ko nozīmē vārds histogramma?
A: Vārds histogramma ir atvasināts no grieķu valodas histos un gramma. Histos nozīmē tīmeklis vai masts. Gramma nozīmē zīmējumu, pierakstu vai rakstu.
J: Ko grieķu valodā nozīmē termins "histos"?
A: Termins "histos" grieķu valodā nozīmē tīmeklis vai masts.
J: Ko grieķu valodā nozīmē termins "gramma"?
A: Termins "gramma" grieķu valodā nozīmē zīmējumu, ierakstu vai rakstu.
J: Kāda ir histogrammas kopējā iezīme?
A: Histogrammas kopīgā iezīme ir attēls, kas izveidots no tabulas ar daudzām kategorijām.
J: Kādu informāciju sniedz histogrammas tabula?
A: Histogrammas tabula sniedz informāciju par to, cik daudz paraugu ir katrā kategorijā.
Meklēt