Stjūdenta t sadalījums — definīcija, īpašības un pielietojums

Stjūdenta t sadalījums: skaidra definīcija, galvenās īpašības un praktiski pielietojumi statistikas testos, ticamības intervālos un lineārajā regresijā.

Autors: Leandro Alegsa

Studenta t sadalījums ir varbūtībassadalījums, ko 1908. gadā izstrādāja Viljams Sēlijs Gosets. Students ir pseidonīms, ko viņš lietoja, publicējot darbu, kurā aprakstīts šis sadalījums. Gosets strādāja alus darītavā un interesējās par problēmām, kas saistītas ar maziem paraugiem, piemēram, miežu ķīmiskajām īpašībām. Problēmās, kuras viņš analizēja, parauga lielums varēja būt tikai trīs. Viena no versijām par pseidonīma izcelsmi ir tāda, ka Gosē darba devējs deva priekšroku darbiniekiem, publicējot zinātniskus darbus, lietot pseidonīmus, nevis savu īsto vārdu, tāpēc viņš izmantoja vārdu "Students", lai slēptu savu identitāti. Cita versija ir tāda, ka alus darītava nevēlējās, lai konkurenti uzzinātu, ka viņi izmanto t-testu, lai pārbaudītu izejvielu kvalitāti.

Kas tas ir un kāpēc tas radās

Mazās izlases apjoma dēļ nav iespējams precīzi novērtēt standartnovirzi. Turklāt daudzos gadījumos, ar kuriem saskārās Gosset, izlases varbūtības sadalījums nebija zināms. Lai ņemtu vērā papildu nenoteiktību, kas rodas no standartnovirzes aprēķina mazos paraugos, tika izveidots t sadalījums, kas apraksta to, kā mainās kvantitāte, kas satur izlases vidējo un standartnovirzi.

Attiecība pret normālo sadalījumu

Normālais sadalījums apraksta visu populāciju, bet t sadalījums apraksta paraugus, kas ņemti no visas populācijas; attiecīgi t sadalījums katram parauga lielumam ir atšķirīgs, un, jo lielāks paraugs, jo vairāk sadalījums līdzinās normālajam sadalījumam. Jo vairāk brīvības pakāpes (ν), jo t astes kļūst plānākas un robeža ν → ∞ dod standarta normālo sadalījumu.

Galvenās īpašības

  • Simetrija: T sadalījums ir simetrisks ap nulli.
  • Zvanu forma un smagākas astes: Tas ir zvana formas kā normālais sadalījums, bet ar smagākām astēm — lielākas varbūtības galējiem novērojumiem.
  • Vidējā vērtība un mediāna: Simetrisku īpašību dēļ vidējā vērtība un mediāna ir 0 (ja ν > 1).
  • Dispersija: Ja ν > 2, tad dispersija = ν/(ν − 2); ja 1 < ν ≤ 2, dispersija ir bezgalīga; ja ν ≤ 1, pat vidējā vērtība nav definēta.
  • Brīvības pakāpes (ν): Tās nosaka sadalījuma formu — tipiski viena parauga gadījumā ν = n − 1, kur n ir parauga lielums.
  • Robustums: Tiek uzskatīts, ka t-testu procedūras ir salīdzinoši robustas mazām novirzēm no normāluma, bet stipri nesimetriskos vai smagstu astu gadījumos jābūt piesardzīgiem.

Formāla definīcija (vienkāršoti)

Ja ņemam n novērojumu izlasi no normāla sadalījuma, tad t sadalījumu ar ν = n-1 brīvības pakāpēm var definēt kā patiesā vidējā lieluma atrašanās vietas sadalījumu attiecībā pret izlases vidējo lielumu un dalītu ar izlases standartnovirzi pēc reizināšanas ar normalizējošo lielumu n {\displaystyle {\sqrt {n}}}. {\displaystyle {\sqrt {n}}}. Šādā veidā t sadalījumu var izmantot, lai novērtētu, cik ticams, ka patiesais vidējais atrodas jebkurā noteiktā diapazonā.

Praktiskie pielietojumi

T sadalījumam ir liela nozīme daudzās plaši izmantotās statistiskās analīzēs:

  • Vienspējas (one-sample) t-tests: novērtē, vai parauga vidējā vērtība atšķiras no zināmas populācijas vērtības.
  • Divu izlases t-tests: salīdzina divu neatkarīgu paraugu vidējos — gan ar pieņēmumu par vienādām dispersijām (Student's t), gan bez tā (Welch's t).
  • Pāru t-tests (paired t-test): izmanto atkārtotas mērījumu vai saistītu vienību rezultātu salīdzināšanai.
  • Ticamības intervāli: veido ticamības intervālus populācijas vidējai vērtībai, ņemot vērā nezināmo dispersiju.
  • Lineārā regresija: t-statistika tiek izmantota regresijas koeficientu nozīmīguma testēšanai.
  • Bejasa analīze: t-distribūcija parādās normālas saimes datu Bejasa modeļos kā viens no iespējamiem kļūdu sadalījumiem vai kā ierobežotas informācijas izteiksme par dispersiju.

Priekšnoteikumi un ierobežojumi

  • Neatkarība: novērojumiem jābūt neatkarīgiem.
  • Normālums: paraugs tiek uzskatīts nācis no normālas populācijas vai vismaz pietiekami tuvai tai; mazās izlases gadījumā normaļuma pārkāpumi var stipri ietekmēt rezultātus.
  • Neliels paraugs: t-procedūras ir īpaši paredzētas maziem paraugiem, bet ar palielinātu parauga lielumu tās tuvojas normālam sadalījumam.

Kā interpretēt rezultātus

T-testu rezultāts parasti tiek izteikts kā t-statistika un tās p-vērtība. Liela absolūtā t-statistika vai maza p-vērtība norāda, ka novērotā parauga vidējā vērtība ir maz ticama, ja pieņem, ka nulles hipotēze (piem., nav atšķirības) ir pareiza. Ticamības intervāls, kas iegūts, izmantojot t-kritiskās vērtības (no t-tabulas ar atbilstošu ν), sniedz intervālu, kurā ar noteiktu ticamību (piem., 95%) atrodas populācijas vidējā vērtība.

Piemērs īsi

Ja ir izlase ar n = 10 un aprēķināta izlases vidējā x̄ un izlases standartnovirze s, tad viena parauga t-statistiku, testējot hipotēzi H0: μ = μ0, aprēķina kā t = (x̄ − μ0) / (s/√n). Šim t ir sadalījums ar ν = 9 brīvības pakāpēm.

Papildu piezīmes

T sadalījums ir noderīgs rīks statistiskajai analīzei, jo tas kompensē papildu nenoteiktību, kas rodas, ja dispersija tiek aptuveni novērtēta no izlases. Tomēr, ja pieejams ļoti liels paraugs vai ja dispersija ir zināma, bieži lieto normālo sadalījumu. Tāpat pastāv alternatīvas metodes (piem., permutāciju testi vai neparametriskie testi), ja normāluma pieņēmums būtiski netiek ievērots.

Jautājumi un atbildes

J: Kas ir Studenta t-distribūcija?


A: Stjūdenta t-distribūcija ir varbūtības sadalījums, ko 1908. gadā izstrādāja Viljams Silijs Gosets. Tas apraksta paraugus, kas ņemti no pilnas populācijas, un, jo lielāks ir parauga lielums, jo vairāk tas atgādina normālo sadalījumu.

J: Kas izstrādāja Studenta t-izplatījumu?


A: Viljams Silijs Gosets 1908. gadā izstrādāja Studenta t-izplatījumu. Publicējot to aprakstošo darbu, viņš izmantoja pseidonīmu "Students".

J: Kādi ir daži no Stjūdenta t-distribūcijas izmantošanas veidiem?


A: Stjūdenta t-distribūcijai ir nozīme daudzās plaši izmantotās statistiskās analīzēs, tostarp Stjūdenta t-testā, lai novērtētu divu izlases vidējo lielumu atšķirību statistisko nozīmīgumu, konstruētu ticamības intervālus divu populācijas vidējo lielumu atšķirībām un veiktu lineāro regresijas analīzi. Tas rodas arī Bejasa analīzē, analizējot datus no normālās saimes.

J: Kā izlases lielums ietekmē t-distribūcijas formu?


A: Jo lielāks ir izlases lielums, jo vairāk tas līdzinās normālajam sadalījumam. Katram atšķirīgam izlases lielumam ir atbilstošs unikāls t-iedalījums, kas to apraksta.

Vai ir kāda saistība starp Studenta T sadalījumu un normālo sadalījumu?


A: Jā - normālais sadalījums apraksta pilnas populācijas, bet studenta T sadalījums apraksta paraugus, kas ņemti no šīm populācijām; tādējādi tiem ir kopīgas iezīmes, bet tie atšķiras atkarībā no to lieluma. Kā minēts iepriekš, lielākas izlases mēdz vairāk līdzināties normālajam sadalījumam nekā mazākas.

Vai ir vēl kāds cits šāda veida sadalījuma nosaukums?


A: Nē - šis sadalījuma veids ir pazīstams kā "Studenta T sadalījums", kas nosaukts tā izstrādātāja Viljama Sēlija Goseta vārdā, kurš, publicējot savu darbu par šo sadalījumu, izmantoja pseidonīmu "Students".


Meklēt
AlegsaOnline.com - 2020 / 2025 - License CC3