KORELACJA
Zależność statystyczna zmiennych losowych– związek pomiędzy dwiema zmiennymi losowymi X i Y.
Intuicyjnie, zależność dwóch zmiennych oznacza, że znając wartość jednej z nich, dałoby się przynajmniej w niektórych sytuacjach dokładniej przewidzieć wartość drugiej zmiennej, niż bez tej informacji.
Współczynnik korelacji liniowej
Jednym z najważniejszych mierników wykorzystywanych w analizie korelacji, określania w jakim stopniu zmienne są współzależne lub inaczej też określa poziom zależności liniowej między zmiennymi losowymi, jest współczynnik korelacji liniowej Pearsona.
Jego formuła obliczeniowa jest następująca
rxy = cov(xy) / S(x) * S(y)
współczynnik jest symetryczny czyli
rxy = ryx
Przyjęto oceniać, na podstawie wyniku i znaku, siłę i kierunek współzależności w następujący sposób:
/0,0-0,2/ - współzależność bardzo słaba
/0,2-0,4/ - współzależność słaba
/0,4-0,6/ - współzależność umiarkowana
/0,6-0,8/ - współzależność silna
/0,8-1,0/ - współzależność bardzo silna
Zależność a współczynnik korelacji
Często błędnie zakłada się, że zależność statystyczna jest równoważna niezerowemu współczynnikowi korelacji. Nie jest to prawda. Na przykład zmienne X i Y mogą być związane zależnością:
Brak komentarzy:
Prześlij komentarz