Care este teorema limită centrală?

Care este teorema limită centrală?
Anonim

Răspuns:

Teorema limită centrală face riguroasă ideea intuitivă că estimările mediei (estimate dintr-o probă) a unor măsurători asociate cu o anumită populație se îmbunătățesc pe măsura creșterii mărimii eșantionului.

Explicaţie:

Imaginați-vă o pădure care conține 100 de copaci.

Acum imaginați-vă (destul de nerealist) că, măsurat în metri, un sfert dintre ei are o înălțime de 2, un sfert dintre ei au o înălțime de 3, un sfert dintre ei au o înălțime de 4, iar un sfert dintre ei au înălțime de 5.

Imaginați-vă măsurarea înălțimii fiecărui arbore din pădure și folosirea informațiilor pentru a construi o histogramă cu dimensiuni ale coșului ales (de exemplu, 1,5 până la 2,5, 2,5 până la 3,5, 3,5 până la 4,5 și 5,5 până la 6,5, realizez că nu am specificat binul la care apar limitele, dar nu contează aici).

Puteți utiliza histograma pentru a estima distribuția probabilităților copacilor. În mod evident, nu ar fi unul normal.De fapt, furnizarea punctelor finale a fost aleasă în mod corespunzător, ar fi una uniformă deoarece ar fi un număr egal de arbori corespunzând uneia dintre înălțimile specificate în fiecare coș.

Acum imaginați-vă să mergeți în pădure și să măsurați înălțimea a doar doi copaci; calculați înălțimea medie a acestor doi copaci și notați-o. Repetați acea operație de mai multe ori, astfel încât să aveți o colecție a valorilor medii pentru eșantioanele de mărimea 2. Dacă ați complotat o histogramă a estimărilor mediei, nu ar mai fi uniformă. În schimb, este probabil să existe mai multe măsurători (estimări ale mediei bazate pe eșantioane de mărimea 2) în apropierea înălțimii medii totale a tuturor arborilor din pădure (în acest caz particular,

#(2 + 3 + 4 + 5)/4 = 3.5# m).

Cum ar fi mai multe estimări ale mediei aproape adevărata populație înseamnă (care este cunoscută în acest exemplu nerealist), decât departe de media, forma acestei noi histograme ar fi mai aproape de o distribuție normală (cu un vârf în apropierea mediei).

Acum, imaginați-vă să mergeți în pădure și să repetați exercițiul, cu excepția faptului că măsurați înălțimea a 3 copaci, calculând media în fiecare caz și notați-o. Histograma pe care ați construi-o va avea și mai multe estimări ale mediei în apropierea adevăratului mediu, cu o răspândire mai mică (șansa de a alege trei copaci în orice probă astfel încât toți să provină de la una din grupurile finale - înalt sau foarte scurt --- este mai puțin decât alegerea a trei copaci cu o selecție de înălțimi). Forma histogramei dvs. cuprinzând o estimare a dimensiunii medii (fiecare medie pe baza a trei măsurători) ar fi mai apropiată de cea a unei distribuții normale, iar abaterea standard corespunzătoare (a estimărilor mediei, nu a populației părinte) ar fi mai mici.

Repetați acest lucru pentru 4, 5, 6, etc copaci pe medie, iar histograma pe care ați construi-o ar arăta tot mai mult ca o distribuție normală (cu dimensiuni progresive mai mari ale eșantioanelor), cu media distribuția estimări ale mediei fiind mai apropiat de media reală, iar abaterea standard a estimărilor medie devenind mai îngustă și mai restrânsă.

Dacă repetați exercițiul pentru cazul (degenerat) în care toți copacii sunt măsurați (în mai multe rânduri, făcând o notă a mediei în fiecare caz), atunci histograma va avea estimări ale mediei numai într-unul din coșuri (cea care corespunde mediei reale), fără vreo variație, astfel încât deviația standard (distribuția de probabilitate estimată) să fie zero.

Astfel, teorema limitei centrale notează că media unei estimări a mediei unei anumite populații se apropie asimptotic de media reală, iar abaterea standard a estimării mediei (mai degrabă decât deviația standard a distribuției populației mamă) devine progresiv mai mic pentru mărimea eșantionului mai mare.