Distribuția utilizată pentru testul ipotezei este una nouă. Se numește distribuția F, numită după Sir Ronald Fisher, un statistician englez. Statistica F este un raport (o fracție). Există două seturi de grade de libertate; unul pentru numărător și unul pentru numitor.

frecvent frecvent

De exemplu, dacă F urmărește o distribuție F și numărul de grade de libertate pentru numărător este de patru, iar numărul de grade de libertate pentru numitor este de zece, atunci F

Distribuția F este derivată din distribuția t a Studentului. Valorile distribuției F sunt pătrate ale valorilor corespunzătoare ale distribuției t. One-Way ANOVA extinde testul t pentru compararea mai mult de două grupuri. Scopul acelei derivări depășește nivelul acestui curs.

Pentru a calcula raportul F, se fac două estimări ale varianței.

  1. Varianța între probe: O estimare a lui σ 2 care este varianța eșantionului înseamnă înmulțită cu n (când dimensiunile eșantionului sunt aceleași.). Dacă eșantioanele au dimensiuni diferite, diferența dintre eșantioane este ponderată pentru a ține cont de diferitele dimensiuni ale eșantionului. Varianța se mai numește variație datorată tratamentului sau variație explicată.
  2. Varianța în eșantioane: O estimare a lui σ 2 care este media varianțelor eșantionului (cunoscută și sub numele de varianță cumulată). Atunci când dimensiunile eșantionului sunt diferite, variația în eșantioane este ponderată. Varianța se mai numește variație datorată erorii sau variației inexplicabile.
  • SS între: suma pătratelor care reprezintă variația dintre diferitele eșantioane
  • SSwithin = suma pătratelor care reprezintă variația din eșantioane care se datorează întâmplării.

A găsi o „sumă de pătrate” înseamnă a aduna împreună cantități pătrate care, în unele cazuri, pot fi ponderate.

MS înseamnă „medie pătrată.”MSbetween este varianța dintre grupuri, iar MSwithin este varianța în cadrul grupurilor.

Calculul sumei pătratelor și pătratului mediu

k = numărul diferitelor grupuri

nj = dimensiunea grupului jth

sj = suma valorilor din grupul j

n = numărul total al tuturor valorilor combinate (dimensiunea eșantionului total: ∑n j)

Suma pătratelor din toate valorile din fiecare grup combinat: ∑
x 2

Variația explicată: suma pătratelor care reprezintă variația între diferitele eșantioane:
[latex] \ displaystyle _ >> = \ sum)> ^ >> _ >>]> - \ frac _>)> ^ >>> [/ latex]

Variație inexplicabilă: suma pătratelor care reprezintă variația în eșantioane din cauza întâmplării:
[latex] \ displaystyle _ >> = _ >> -_ >> [/ latex]

df-uri pentru diferite grupuri (df-uri pentru numărător): df = k - 1

Ecuație pentru erori din eșantioane (df pentru numitor):

Pătratul mediu (estimarea varianței) care se datorează întâmplării (inexplicabil):
[latex] \ displaystyle _ >> = \ frac _ >>>> _ >>>> [/ latex]

MSbetween și MSwithin pot fi scrise după cum urmează:

Testul ANOVA unidirecțional depinde de faptul că
MS între ele poate fi influențat de diferențele de populație între mijloacele din mai multe grupuri. Deoarece MSwithin compară valorile fiecărui grup cu media sa de grup, faptul că mijloacele de grup pot fi diferite nu afectează MSwithin.

Ipoteza nulă spune că toate grupurile sunt eșantioane din populații cu aceeași distribuție normală. Ipoteza alternativă spune că cel puțin două dintre grupurile de eșantioane provin din populații cu distribuții normale diferite. Dacă ipoteza nulă este adevărată,
MSbetween și MSwithin ar trebui să estimeze ambele aceeași valoare.

Ipoteza nulă spune că toate mijloacele populației de grup sunt egale. Ipoteza mijloacelor egale implică faptul că populațiile au aceeași distribuție normală, deoarece se presupune că populațiile sunt normale și că au varianțe egale.

F-Ratio sau F Statistic

Dacă
MSbetween și MSwithin estimează aceeași valoare (urmând credința că H0 este adevărat), atunci raportul F ar trebui să fie aproximativ egal cu unul. În cea mai mare parte, doar erorile de eșantionare ar contribui la variații departe de una. După cum se dovedește, MSbetween constă în varianța populației plus o varianță produsă din diferențele dintre eșantioane. MSwithin este o estimare a varianței populației. Deoarece variațiile sunt întotdeauna pozitive, dacă ipoteza nulă este falsă, MSbetween va fi în general mai mare decât MSwithin. Apoi raportul F va fi mai mare decât unul. Cu toate acestea, dacă efectul populației este mic, nu este puțin probabil ca MSwithin să fie mai mare într-un eșantion dat.

Calculele de mai sus au fost făcute cu grupuri de diferite dimensiuni. Dacă grupurile au aceeași dimensiune, calculele se simplifică oarecum și
Raportul F poate fi scris ca:

Formula F-Ratio atunci când grupurile au aceeași dimensiune

  • n = dimensiunea eșantionului
  • dfnumerator = k - 1
  • dfdenominator = n - k
  • s 2 grupat = media varianțelor eșantionului (varianță colectată)
  • [latex] \ displaystyle _ >> ^ >>> [/ latex] = varianța eșantionului înseamnă

Datele sunt de obicei plasate într-un tabel pentru vizualizare ușoară. Rezultatele ANOVA unidirecționale sunt adesea afișate în acest mod de către software-ul computerului.

Sursa variației Suma de pătrate (
SS) Gradele de libertate (
df) Pătrat mediu (
MS) F
Factor (între) SS (factor) k - 1 MS (factor) = SS (factor)/(k - 1) F = MS (Factor)/MS (Eroare)
Eroare (înăuntru) SS (Eroare) n - k MS (Error) = SS (Error)/(n –k)
Total SS (Total) n - 1

Exemplu

Trei planuri dietetice diferite vor fi testate pentru pierderea medie în greutate. Intrările din tabel reprezintă pierderile în greutate pentru diferite planuri. Rezultatele ANOVA unidirecționale sunt prezentate în tabelul de aici.

Planul 1:
n1 = 4 Planul 2:
n2 = 3 Planul 3:
n3 = 3
5 3.5 8
4.5 7 4
4
3 4.5

Următoarele sunt calculele necesare pentru completarea tabelului ANOVA unidirecțional. Tabelul este utilizat pentru a efectua un test de ipoteză.

Folosind un calculator

Tabel ANOVA unidirecțional: Formulele pentru
SS (Total), SS (Factor) = SS (Între) și SS (Eroare) = SS (În interior) așa cum se arată anterior.

Aceleași informații sunt furnizate de funcția de testare a ipotezei calculatorului TI ANOVA în STAT TESTS (sintaxa este ANOVA (L1, L2, L3) unde L1, L2, L3 au datele din Planul 1, Planul 2, respectiv Planul 3).

Sursa variației Suma de pătrate (
SS) Gradele de libertate (
df) Pătrat mediu (
MS) F
Factor (între) SS (Factor) = SS (Între) = 2.2458 k - 1 = 3 grupuri - 1 = 2 MS (factor) = SS (factor)/(k– 1) = 2.2458/2 = 1.1229 F = MS (Factor)/MS (Eroare) = 1,1229/2,9792 = 0,3769
Eroare (înăuntru) SS (Eroare) = SS (În interior) = 20.8542 n - k = 10 date totale - 3 grupuri = 7 MS (Error) = SS (Error)/(n– k) = 20.8542/7 = 2.9792
Total SS (Total) = 2.2458 + 20.8542 = 23.1 n - 1 = 10 date totale - 1 = 9

Incearca-l

Ca parte a unui experiment pentru a vedea cum diferite tipuri de acoperire a solului ar afecta felierea producției de roșii, studenții Colegiului Marist au cultivat plante de roșii în diferite condiții de acoperire a solului. Grupuri de câte trei plante au avut fiecare dintre următoarele tratamente

  • sol gol
  • o acoperire de sol comercială
  • plastic negru
  • paie
  • compost

Toate plantele au crescut în aceleași condiții și au fost același soi. Elevii au înregistrat greutatea (în grame) a roșiilor produse de fiecare dintre n = 15 plante:

Neizolat:
n1 = 3 Capac de sol:
n2 = 3 Plastic:
n3 = 3 Paie:
n4 = 3 Compost:
n5 = 3
Cea mai comună 2.625 5.348 cea mai frecventă Cea mai frecventă 6.583 7.285 cel mai frecvent Cea mai frecventă 6277 a
2.997 e cel mai frecvent 5.682 e cel mai frecvent Cel mai frecvent 8,560 6.897 este cel mai frecvent Cel mai frecvent 7.818
4.915 e cel mai frecvent 5.482 cea mai frecventă 3.830 este cel mai frecvent 9,230 e cel mai frecvent 8.677 e cel mai frecvent

Creați tabelul ANOVA unidirecțional.

Introduceți datele în listele L1, L2, L3, L4 și L5. Apăsați STAT și săgeata la TESTS. Săgeata în jos către ANOVA. Apăsați ENTER și introduceți L1, L2, L3, L4, L5). Apasa Enter. Tabelul a fost completat cu rezultatele calculatorului.

Masă ANOVA unidirecțională:

Sursa variației Suma de pătrate (
SS) Gradele de libertate (
df) Pătrat mediu (
MS) F
Factor (între) 36.648.561 5 - 1 = 4 [latex] \ displaystyle \ frac, >>> =, [/ latex] [latex] \ displaystyle \ frac, >>, >> = [/ latex]
Eroare (înăuntru) 20.446.726 15 - 5 = 10 [latex] \ displaystyle \ frac, >>> =, [/ latex]
Total 57.095.287 15 - 1 = 14

Testul de ipoteză ANOVA unidirecțional este întotdeauna cu coada dreaptă, deoarece este mai mare
Valorile F sunt ieșite în coada dreaptă a curbei de distribuție F și tind să ne facă să respingem H 0.

Notaţie

Notarea pentru distribuția F este F

Referințe

Tomato Data, Marist College School of Science (cercetare nepublicată a studenților)

Revizuirea conceptului

Analiza varianței compară mediile unei variabile de răspuns pentru mai multe grupuri. ANOVA compară variația din fiecare grup cu variația mediei fiecărui grup. Raportul dintre aceste două este
Statistică F dintr-o distribuție F cu (număr de grupuri - 1) ca număr de grade de libertate și (număr de observații - număr de grupuri) ca grade de libertate de numitor. Aceste statistici sunt rezumate în tabelul ANOVA.

Formula Review

df între = df (num) = k - 1

Unde:
k = numărul de grupuri nj = mărimea grupului j sj = suma valorilor din grupul j n = numărul total al tuturor valorilor (observații) combinate x = o valoare (o observație) din datele [latex] \ displaystyle _ >> ^ >>> [/ latex] = media varianțelor eșantionului (varianță cumulată)