Lielo skaitļu likums — definīcija, piemēri un nozīme statistikā

Lielo skaitļu likums (LLN) ir teorēma no statistikas. Aplūkojiet kādu procesu, kurā notiek nejauši iznākumi. Piemēram, nejaušs mainīgais tiek novērots atkārtoti. Tad novēroto vērtību vidējā vērtība ilgtermiņā būs stabila. Tas nozīmē, ka ilgtermiņā novēroto vērtību vidējā vērtība arvien vairāk tuvosies gaidāmajai vērtībai.

Metot metamo kauliņu, iespējamie iznākumi ir skaitļi 1, 2, 3, 4, 5 un 6. Tie visi ir vienlīdz ticami. Iznākumu populācijas vidējā vērtība (jeb "sagaidāmā vērtība") ir šāda:

(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5.

Nākamajā grafikā ir attēloti eksperimenta rezultāti, kas iegūti, metot metamo kauliņu. Šajā eksperimentā redzams, ka sākumā kauliņa metienu vidējā vērtība ir ļoti atšķirīga. Kā paredz LLN, vidējais rādītājs nostabilizējas ap sagaidāmo vērtību 3,5, kad novērojumu skaits kļūst liels.

A demonstration of the Law of Large Numbers using die rolls

Kas LLN faktiski nozīmē (formāli)

Ir divas bieži minētas variācijas:

  • Vājais lielo skaitļu likums (Weak LLN): ja X1, X2, ... ir neatkarīgi un vienādi izplatīti (i.i.d.) nejaušie mainīgie ar finišu sagaidāmo vērtību μ, tad par katru ε > 0 izpildās P(|X̄n − μ| > ε) → 0 kā n → ∞. Tas nozīmē, ka varbūtība, ka parauga vidējā vērtība krasi atšķiras no μ, paliek ļoti maza, ja novērojumu skaits ir liels.
  • Stiprā lielo skaitļu likums (Strong LLN): zem līdzīgiem nosacījumiem parauga vidējā vērtība konverģē uz μ gandrīz noteikti (almost surely), t.i., X̄n → μ gandrīz visos gadījumos, kad n → ∞.

Nosacījumi un ierobežojumi

  • Neatkarība un/vai vienāda sadalījuma: vienkāršākie formulējumi pieprasa, lai novērojumi būtu i.i.d. Pastāv arī vispārīgāki rezultāti (piem., Kolmogorova likums) neatkarīgiem, bet nevajadzīgi identiski sadalītiem mainīgajiem.
  • Finita sagaidāmā vērtība: nepieciešams, lai sagaidāmā vērtība μ būtu galīga. Dažiem spēcīgajiem rezultātiem var prasīt arī galīgu dispersiju vai citus momentus.
  • Neapgalvo par ātrumu: LLN garantē konverģenci, bet tas nenozīmē, cik ātri notiek tuvināšanās. Par ātrumu runā centrālo robežas teorēma (CRT), kas nosaka, ka kļūda parasti samazinās aptuveni kā 1/√n.

Piemēri un ilustrācijas

  • Kauliņa mešana: kā redzams augstāk, pēc daudziem metieniem parauga vidējais rezultāts pietuvosies 3.5.
  • Monētas mešana: ja sagaidāmais iznākums (piem., varbūtība galvai) ir 0.5, tad ilgā laikā relatīvais galvu īpatsvars parasti tuvosies 0.5.
  • Parauga vidējā: ja mēra, piemēram, cilvēku augumus vai ienākumus, parauga vidējais kļūst uzticamāks, palielinoties izlases lielumam (pie nosacījuma, ka izlase ir reprezentatīva un novērojumi patiesi ir tuvi neatkarībai).

Nozīme statistikā un praksē

  • Konsekvence: lielo skaitļu likums nodrošina, ka daudzi statistikas novērtējumi (piem., parauga vidējais) ir konsistenti — tie konverģē uz patieso parametr vērtību, palielinoties datu skaitam.
  • Reliability of averages: uzņēmumos, apdrošināšanā vai ražošanā novērojumu skaita palielināšana parasti samazina svārstību ietekmi un ļauj pieņemt drošākus lēmumus.
  • Praktiskās brīdinājumi: LLN nepiešķir nozīmi datu kvalitātei — ja novērojumi nav neatkarīgi (piem., laika rindas ar autokorelāciju) vai ir sistemātiski aizspriedumi (bias), tad vidējais var nekonverģēt uz vēlamo vērtību.

Savienojums ar citām teorēmām

  • Centrālā robežas teorēma (CRT): sniedz informāciju par to, kā sadalās parauga vidējā apkārt μ, aptuveni normāli ar standarddeviāciju ~σ/√n. CRT paplašina LLN, jo rāda kļūdas izplatību un ātrumu.
  • Likums praksē: LLN ir pamats, kāpēc statistiskās metodes balstās uz vidējiem rādītājiem un lielām izlases: ar vairāk datiem tiek iegūtas precīzākas prognozes un ticamāki secinājumi.

Bieži sastopamas kļūdas un mīti

  • "LLN sola, ka īsā laikā viss izlīdzinās": nē — tas attiecas uz lieliem n. Dažreiz nepieciešams ļoti liels novērojumu skaits, īpaši, ja dispersija ir liela.
  • "Pēdējie novērojumi kompensē iepriekšējos": LLN neparedz, ka tuvākos metienos notiks pretējas svārstības (nav kā likums, kas piesaka "atdošanu"). Tas attiecas tikai uz ilgtermiņa vidējas uzvedības konverģenci.

Kopsavilkums

Lielo skaitļu likums ir viens no fundamentālajiem principiem statistikā: tas nodrošina, ka paraugu vidējie rādītāji, pie izpildītiem nosacījumiem, tuvosies patiesajai sagaidāmajai vērtībai, ja novērojumu skaits palielinās. Tomēr svarīgi saprast nosacījumus (piem., neatkarību, finišu momentu esamību) un to, ka likums neparedz konverģences ātrumu — par to informāciju sniedz centrālā robežas teorēma un citi rezultāti.

Vēsture

Džeikobs Bernuili pirmais aprakstīja LLN. Viņš apgalvoja, ka tas ir tik vienkārši, ka pat vismuļķīgākais cilvēks instinktīvi zina, ka tas ir taisnība. Neskatoties uz to, viņam bija vajadzīgi vairāk nekā 20 gadi, lai izstrādātu labu matemātisku pierādījumu. Kad viņš to bija atradis, viņš 1713. gadā publicēja pierādījumu grāmatā Ars Conjectandi (Konjicēšanas māksla). Viņš to nosauca par savu "Zelta teorēmu". Tā kļuva pazīstama kā "Bernuļa teorēma" (nejaukt ar fizikas likumu ar tādu pašu nosaukumu). 1835. gadā S. D.Pjērsons to aprakstīja tālāk ar nosaukumu "Lielo skaitļu likums" (La loi des grands nombres). Pēc tam tas bija pazīstams ar abiem nosaukumiem, bet visbiežāk tiek lietots "Lielo skaitļu likums".

Arī citi matemātiķi deva savu ieguldījumu likuma pilnveidošanā. Daži no viņiem bija Čebiševs, Markovs, Borels, Kantelli un Kolmogorovs. Pēc šiem pētījumiem tagad pastāv divas dažādas likuma formas: Viens no tiem tiek saukts par "vājo" likumu, bet otrs - par "stipro" likumu. Šīs formas neapraksta atšķirīgus likumus. Tām ir dažādi veidi, kā aprakstīt novērotās vai izmērītās varbūtības konverģenci pie faktiskās varbūtības. Likuma spēcīgā forma nozīmē vāju likumu.


AlegsaOnline.com - 2020 / 2025 - License CC3