11.11.2012

 

 KORELACJA



Zależność statystyczna zmiennych losowych– związek pomiędzy dwiema zmiennymi losowymi X i Y.
Intuicyjnie, zależność dwóch zmiennych oznacza, że znając wartość jednej z nich, dałoby się przynajmniej w niektórych sytuacjach dokładniej przewidzieć wartość drugiej zmiennej, niż bez tej informacji.


Współczynnik korelacji liniowej
Jednym z najważniejszych mierników wykorzystywanych w analizie korelacji, określania w jakim stopniu zmienne są współzależne lub inaczej też określa poziom zależności liniowej między zmiennymi losowymi, jest współczynnik korelacji liniowej Pearsona.

Jego formuła obliczeniowa jest następująca
rxy = cov(xy) / S(x) * S(y)
współczynnik jest symetryczny czyli
rxy = ryx
Przyjęto oceniać, na podstawie wyniku i znaku, siłę i kierunek współzależności w następujący sposób:
/0,0-0,2/     - współzależność bardzo słaba
/0,2-0,4/     - współzależność słaba
/0,4-0,6/     - współzależność umiarkowana
/0,6-0,8/     - współzależność silna
/0,8-1,0/     - współzależność bardzo silna

Zależność a współczynnik korelacji
Często błędnie zakłada się, że zależność statystyczna jest równoważna niezerowemu współczynnikowi korelacji. Nie jest to prawda. Na przykład zmienne X i Y mogą być związane zależnością:
Y=X^2\and -1\leqslant X\leqslant 1
Jest to przykład ścisłej zależności. Jednak zarówno klasyczna korelacja Pearsona , jak i rangowa  dadzą wartość zero (dla próbki  - bliską zeru), gdyż zależność ta nie jest monotoniczna, ani tym bardziej liniowa.



 



Brak komentarzy:

Prześlij komentarz