Home - qdidactic.com
Didactica si proiecte didacticeBani si dezvoltarea cariereiStiinta  si proiecte tehniceIstorie si biografiiSanatate si medicinaDezvoltare personala
referate didacticaScoala trebuie adaptata la copii ... nu copiii la scoala





Biologie Botanica Chimie Didactica Fizica Geografie
Gradinita Literatura Matematica


Fizica


Qdidactic » didactica & scoala » fizica
Exercitiu - teste de detectare a heteroscedasticitatii si corectarea ei



Exercitiu - teste de detectare a heteroscedasticitatii si corectarea ei


Exercitiu - Teste de detectare a heteroscedasticitatii si corectarea ei


Intr-o intreprindere producatoare de tesaturi textile, directorul de productie doreste sa determine o relatie intre numarul de defecte constatate la balotii de tesaturi, yi, dupa efectuarea verificarii, tinand seama de timpul cat a durat verificarea xi, folosind modelul liniar: .

Pentru aceasta se dispune de informatiile, prezentate in Tabelul 5.3, referitoare la 6 masini de tesut, la care s-au verificat cate 5 baloti de stofa, inregistrandu-se si centralizandu-se numarul de defecte, depistat in orele de control:




Masina i

Nr. ore (xi) 

Numar defecte (yi) i=1,5

1

4

15

14

13

15

16

2

3.5

14

20

21

23

24

3

2

19

21

22

20

29

4

1.5

16

20

24

30

33

5

1

18

22

25

30

41

6

0.5

15

30

31

35

36

Tabelul 5.3. Numarul orelor de control si al defectelor pentru 6 masini de tesut


Sa se aplice urmatoarele teste pentru verificarea heteroscedasticitatii:

1)     testul de egalitate a variantelor;

2)     testul Goldfeld-Quandt;

3)     testul lui Glejser;

4)     in caz de heteroscedasticitate sa se corecteze efectele acesteia.

Rezolvare

1)  Testul de egalitate a variantelor

Se dispune de 6 grupe de observari r = 6. Ipotezele testului sunt urmatoarele:

H0:       . H0 sustine ca nu exista nici o diferenta intre variantele grupelor.

H1:       Exista cel putin o varianta diferita de celelalte, i=1,r.

Etapa1: Se calculeaza varianta pentru fiecare masina de tesut (grupa):

, unde .

Volumul unei grupe i este ni=5; intamplator aici sunt egale.

Dispersiile grupelor sunt prezentate in Tabelul 5.4, si se obtin aplicand formula dispersiei sau o functie statistica de calcul a variantei datelor unui esantion, =VAR(blocul de date), in Excel.

In Tabelul 5.4 sunt efectuate calculele pentru numarul mediu al defectelor si dispersia acestor defecte, pentru fiecare masina de tesut.

Varianta fiecarei grupe arata influenta factorilor reziduali din interiorul fiecarei grupe, asupra variatiei variabilei y. In exercitiul acesta, influenta unor alti factori decat caracteristicile masinilor de tesut asupra numarului defectelor, pot fi: calitatea si caracteristicile firelor de tesut, dificultatea modelelor, indemanarea muncitorilor, starea lor de atentie, experienta in munca, etc.


Masina i

1

14.6

1.3

2

20.4

15.3

3

22.2

15.7

4

24.6

48.8

5

27.2

78.7

6

29.4

71.3

Tabelul 5.4. Calculul variantelor pe grupe


Etapa a 2-a: Se calculeaza media dispersiilor grupelor, care arata influenta factorilor reziduali la nivel de ansamblu. Pentru a obtine acest indicator se utilizeaza media aritmetica ponderata a dispersiilor de grupa:

, cu .

In acest caz ni = 5 si ni = 4, pentru orice i = 1,r. Numarul de masini este r=6.

Valoarea obtinuta pentru media dispersiilor masinilor de tesut este .

Etapa a 3-a: Se calculeaza valoarea unui test empiric c2 * cu r-1 grade de libertate, astfel:

Cantitatea=24 Ln(38.517)-73.056=14.57, urmeaza o lege c2 cu 5 grade de libertate. Aceasta estimatie se poate ameliora prin impartirea la o constanta de scala C:

=1.097.

, urmeaza o lege c2a=5%; 5 grade libertate=11.07. Q=13.28 > 11.07,

= 14.57 > 11.07, rezulta ca modelul este heteroscedastic..

2) Testul Goldfeld-Quandt

Ipoteza nula H0 este cea de homoscedasticitate, iar cea alternativa H1, cea de heteroscedasticitate.

Etapa 1: Se ordoneaza observarile in functie de variabila explicativa xi, in Tabelul 5.5. Aceasta ordonare este deja existenta, orele de verificare (xi), sunt deja in ordine descrescatoare. Graficul din Figura 5.4 arata corelatia inversa dintre numarul defectelor si numarul orelor de verificare.


j

yj

xj

1

15

4

2

14

4

3

13

4

4

15

4

5

16

4

6

14

3.5

7

20

3.5

8


21

3.5

9

23

3.5

10

24

3.5

j

yj

xj

11

19

2

12

21

2

13

22

2

14

20

2

15

29

2

16

16

1.5

17

20

1.5

18

24

1.5

19

30

1.5

20

33

1.5

j

yj

xj

21

18

1

22

22

1

23

25

1

24

30

1

25

41

1

26

15

0.5

27

30

0.5

28

31

0.5

29

35

0.5

30

36

0.5

Tabelul 5.5. Numar defecte/masina, in ordinea descrescatoare a timpului


Figura 5.4. Corelatia inversa dintre numarul defectelor si orele de verificare

Etapa a 2-a: Se omit d observari centrale, aproximativ o patrime din numarul total de observari: d=INT(30/4)=8. Se aleg arbitrar cele 8 observari, situate in centrul esantionului, pentru a fi excluse din analiza.

Etapa a 3-a: Se efectueaza regresiile liniare pe fiecare din cele doua esantioane ramase (in Tabelul 5.5. cele doua esantioane sunt scrise cu format italic) si se calculeaza un test Fisher. Din cele doua tabele de regresie, prezinta interes numai tabelele ANOVA, care sunt prezentate in Tabelul 5.6 pentru primul esantion si Tabelul 5.7, pentru al doilea esantion.


ANOVA 

df

SS

MS

F

Significance F

Regression

1

27.2388

27.2388

1.9564

0.1954

Residual

9

125.3067

13.9230



Total

10

152.5455




Tabelul 5.6. Tabelul ANOVA pentru primul esantion cu observarile j=1,11


ANOVA 

df

SS

MS

F

Significance F

Regression

1

0.1818

0.1818

0.0026

0.9605

Residual

9

632

70.2222



Total

10

632.1818




Tabelul 5.7. Tabelul ANOVA pentru al doilea esantion cu observarile j=20,30


Variantele reziduurilor din cele doua tabele ANOVA sunt:

SSR1=125.31 si SSR2=632.

Raportul empiric urmeaza o lege Fisher cu gl1 si gl2 grade de libertate. Pentru a=5% si gl1=9 si gl2=9, valoarea tabelara este F0.059s9 grd.lib.= 3.18; F* > 3.18, ipoteza de homoscedasticitate H0 se respinge si modelul este heteroscedastic.

3) Testul lui Glejser

Testul se bazeaza pe relatia dintre reziduurile obtinute in urma regresiei clasice, ignorand heteroscedasticitatea si o variabila explicativa suspecta a fi cauza acesteia.

Glejser propune mai multe forme de legatura intre ei si xi:

ei = a0 + a1xi + vi;       ; .

;    ; .

Se respinge ipoteza de homoscedasticitate daca coeficientul a1 al uneia dintre specificatiile anterioare este semnificativ diferit de zero.

Etapa 1: Se efectueaza regresia dintre yj si xj (j=1,30), prin metoda celor mai mici patrate, obtinandu-se tabela de regresie din Tabelul 5.8.

In urma acestei estimari a modelului liniar: yi = 30.65 -3.64xi + ei, se pot calcula reziduurile ei.

Etapa a 2-a: Se efectueaza regresia intre valorile absolute ale reziduurilor si valorile xj, testand cele trei tipuri de relatii alese.

a)     , heteroscedasticitate de tipul  .

In urma regresie se obtine modelul:, cu ratiile Student calculate, mai mari, in modul, decat     (7.15) (-3.75)

valoarea teoretica pentru a=5% si 28 grade de libertate, de 2.048.


SUMMARY OUTPUT






Regression Statistics






Multiple R

0.6300






R Square

0.3969






Adjusted R Square

0.3754






Standard Error

5.9067






Observations

30






ANOVA 

df

SS

MS

F

Significance F


Regression

1

642.9757

642.9757

18.4292

0.00019


Residual

28

976.891

34.889




Total

29

1619.867






Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

30.6489

2.0694

14.8104

0.0000

26.4099

34.8880

X Variable 1

-3.6395

0.8478

-4.2929

0.0002

-5.3761

-1.9029

Tabelul 5.8. Tabela de regresie y=f(x)


b)     , heteroscedasticitate de tipul  .

In urma regresie se obtine modelul:, cu ratiile Student, >2.048 (6.08) (-3.87)

c)      , heteroscedasticitate de tipul . Se obtine

modelul: , cu ratiile Student, >2.048

(1.72)   (3.48)

Numai coeficientul variabilei explicative este semnificativ diferit de 0.

Pentru toate cele trei forme de relatii, valoarea coeficientului de regresie este semnificativ diferita de 0, pentru ca ratia Student empirica, calculata este mai mare decat valoarea critica.

Se respinge ipoteza nula H0 si se accepta faptul dovedit dealtfel si de celelalte teste, ca modelul este heteroscedastic. Forma b) de legatura, poate fi acceptata mai degraba decat celelalte doua, pentru ca ratia |t*| este cea mai mare si coeficientul de determinatie mai mare R2 = 0.3486. Forma a) este apropiata de b), avand R2=0.3352 si ratia Student a coeficientului de regresie apropiata de cea a formei b), desemnata ca fiind cea corespunzatoare.


4) Corectarea heteroscedasticitatii

Cele trei teste au avut ca rezultat aceeasi concluzie: heteroscedasticitatea modelului. Presupunand ca se retine forma a), de relatie liniara intre reziduuri si variabila explicativa, atunci si se utilizeaza regresia ponderata cu factorul , care conduce la un model homoscedastic. Daca se utilizeaza forma b) propusa in urma aplicarii testului Glejser, se utilizeaza o regresie pe datele initiale ponderate cu factorul . Pentru acest exercitiu, se considera forma b) si datele transformate sunt:, , , prezentate in Tabelul 5.9. Noul model este: , unde ej raspunde ipotezelor clasice.


i

zj

x1j

x2j

1

7.50

0.50

2.00

2

7.00

0.50

2.00

3

6.50

0.50

2.00

4

7.50

0.50

2.00

5

8.00

0.50

2.00

6

7.48

0.53

1.87

7

10.69

0.53

1.87

8

11.22

0.53

1.87

9

12.29

0.53

1.87

10

12.83

0.53

1.87

11

13.44

0.71

1.41

12

14.85

0.71

1.41

13

15.56

0.71

1.41

14

14.14

0.71

1.41

15

20.51

0.71

1.41

16

13.06

0.82

1.22

17

16.33

0.82

1.22

18

19.60

0.82

1.22

19

24.49

0.82

1.22

20

26.94

0.82

1.22

21

18.00

1.00

1.00

22

22.00

1.00

1.00

23

25.00

1.00

1.00

24

30.00

1.00

1.00

25

41.00

1.00

1.00

26

21.21

1.41

0.71

27

42.43

1.41

0.71

28

43.84

1.41

0.71

29

49.50

1.41

0.71

30

50.91

1.41

0.71

Tabelul 5.9. Variabilele transformate


Regresia z=f(x1,x2) are tabela de regresie, prezentata in Tabelul 5.10.


SUMMARY OUTPUT






Regression Statistics






Multiple R

0.8840






R Square

0.7814






Standard Error

6.2217






Observations

30






ANOVA 

df

SS

MS

F

Significance F


Regression

2

3875.209

1937.605

50.056

8.26E-10


Residual

28

1083.855

38.709




Total

30

4959.064






Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

0

#N/A

#N/A

#N/A

#N/A

#N/A

X Variable 1

31.0290

2.0611

15.0545

0.0000

26.8069

35.2510

X Variable 2

-3.8219

1.264171

-3.0232

0.0053

-6.4114

-1.2324

Tabelul 5.10. Regresia pe variabilele transformate

Coeficientii modelului initial sunt: si .

Modelul estimat este: , cu ambii coeficienti semnificativi, iar R2=0.78.         


Figura 5.5. Numarul defectelor observate si ajustarea lor cu modelul determinat


Modelul, astfel determinat, are estimatori eficienti, obtinuti in conditii de heteroscedasticitate, cand erorile nu au varianta constanta.




Contact |- ia legatura cu noi -| contact
Adauga document |- pune-ti documente online -| adauga-document
Termeni & conditii de utilizare |- politica de cookies si de confidentialitate -| termeni
Copyright © |- 2024 - Toate drepturile rezervate -| copyright