Estymacja przedziałowa

Estymacja przedziałowa – Estymacja przedziałowa, której twórcą (a dokładniej rzecz ujmując tego pojęcia :)) był statystyk polskiego pochodzenia Jerzy Spława-Neyman, to metoda służącą do oszacowania przedziału na podstawie wyników z próby, który prawdopodobnie zawiera prawdziwą wartość z populacji (której nie znamy i zapewne nigdy nie poznamy). Dla ułatwienia zrozumienia tego pojęcia będziemy omawiali przedział ufności dla średniej. Oczywiście przedział ufności możemy wyznaczać dla różnych miar w naszym badaniu lub serii badań – np. dla średniej, mediany, odchylenia standardowego, różnicy dwóch średnich czy współczynnika korelacji.

Przedział ufności jest zakresem, który prawdopodobnie “łapie” prawdziwą wartość estymowanego parametru (np. średniej w populacji). Wyznaczając ten przedział nie informujemy jednak czytelników naszej pracy dyplomowej czy też artykułu naukowego jedynie o możliwej wartości parametru w populacji, ale przede wszystkim o “jakości” naszej procedury badawczej (ze szczególnym naciskiem na dobór próby). Sprawa z estymacją przedziałową i przedziałami ufności jest dość skomplikowana… a jeśli nie jest, to prowadzi do błędnej interpretacji przedziałów ufności. Napisaliśmy już pobieżnie czym jest przedział ufności więc z chęcią podzielę się z Wami wiedzą dotyczącą tego, czym taki przedział nie jest i o czym nie mówi. Dla przykładu wyobraźmy sobie, że z populacji wszystkich ryb z jeziora Mamry wylosowaliśmy (a racze udało nam się złapać:)) 50 ryb. Powiedzmy, że wszystkie je ważymy i obliczamy średnią wagę złowionych ryb, która wynosi M = 1,5 kg. Czy średnia wszystkich ryb w tym jeziorze to 1,5kg? Zapewne nie. Może jest to 1,2 kg a może 2,3kg… a może 700 gram? Nie dowiemy się tego dopóki nie złowimy każdej jednej ryby z jeziora co jest zapewne mało wykonalne. Mimo wszystko możemy wyznaczyć przedział ufności , który prawdopodobnie zawiera prawdziwą średnią z całej populacji ryb z jeziora Mamry (będziemy niebawem pokazywali w tutorialu jak to zrobić). Przyjmijmy, że nasz przedział ufności wyliczony na podstawie złowionych 50 ryb to <1,1kg – 1,9kg>. Czym jest ten przedział i o czym mówi to magiczne 95%?

Mianowicie, 95%-owy przedział ufności mówi o tym, że jeśli całe nasze życie poświęcimy na łowienie 50-cio elementowych grupek ryb, będziemy to powtarzać tyle razy ile tylko nam się uda i za każdym razem wyznaczać przedział ufności (praktycznie zawsze będzie on trochę inny od pozostałych) to 95 takich przedziałów na 100 będzie zawierało prawdziwą średnią z populacji wszystkich ryb z jeziora Mamry.

1. Przedział ufności nie mówi o tym, że na 95% prawdziwa średnia w populacji jest gdzieś pomiędzy 1,1kg a 1,9kg. Prawdziwa średnia waga w populacji ryb jest wartością stała i nieznaną. Nie możemy odnosić się do średniej w populacji mówiąc o jakimkolwiek prawdopodobieństwie jej dotyczącym. Ta wartość wynosi X (nie wiemy ile) KONIEC I KROPKA. Jeśli mówimy, że na 95% średnia wartość w populacji zawiera się w jakimś przedziale to tak jakbyśmy mówili, że raz wynosi tyle, a raz wynosi tyle, że “porusza się” bezustannie i na 95% wpadła nam do naszego przedziału. NIE. Prawdziwa średnia w populacji albo jest w tym przedziale, albo jej tam nie ma. Żadne prawdopodobieństwo nie jest w to zamieszane.

Wyobraźcie sobie, że jesteście stwórcami tego świata i wiecie, że średnia waga wszystkich ryb w jeziorze Mamry to 1,3kg. Patrzycie z góry na jakiegoś wędkarza, który złowił przez cały tydzień 50 ryb i przez to, że korzystał ze specjalnej przynęty złowił same duuuże, ciężkie ryby. Jego średnia w próbie wyniosła 3,3 kg a przedział ufności wyniósł <3kg – 3,6kg>. Czy prawdziwe będzie stwierdzenie mówiące o tym, że prawdziwa średnia wynosząca 1,3kg na 95% jest w jego przedziale? NIE. Jej tam nie ma na 100%. Gdyby złowił mniejsze ryby, a wyliczony przez niego przedział wyniósłby <1kg – 1,6kg> to moglibyśmy powiedzieć, że TAK, na 100% prawdziwa średnia jest w jego przedziale.

Pamiętajcie, że to nasze przedziały zmieniają się z badania na badanie, a nie prawdziwa wartość estymowanej średniej w populacji. Ona się nie zmienia dlatego nie możemy mówić o prawdopodobieństwie w nawiązaniu do niej tylko w nawiązaniu do przedziału ufności.

Nam pozostaje jedynie wierzyć i trzymać mocno kciuki za to, że próba, na podstawie której obliczyliśmy przedział ufności dla jakiejś wartości jest na tyle dobra, że nasz przedział należy do tych 95% przedziałów które zawierają prawdziwą wartość z populacji a nie do tych 5%, które jej nie zawierają.

2. Przedział ufności nie oznacza też, że 95% wszystkich ryb w jeziorze Mamry waży nie mniej niż 1,1kg oraz nie więcej niż 1,9%. Możliwe, że jakimś dziwnym trafem złowimy 10 malutkich płotek ważących po kilkadziesiąt gram. Może zasadzimy się na suma i złowimy ich kilkanaście, a każdy z nich będzie ważył przynajmniej 20 kilogramów. Nie wiemy gdzie w porównaniu do całej populacji ryb w jeziorze znajduje się nasza próbka. Wiemy tylko, że zapewne zrobiliśmy wszystko co w naszej mocy, żeby była ona reprezentatywną i odpowiednio liczną próbką całej populacji.

Możliwych błędów jest jeszcze kilka, ale z dwoma powyższymi spotkałem się najczęściej. Wszystkim, którzy chcą zgłębić temat bardziej niż pobieżnie polecam wpisanie w googlach “confidence interval misconception” oraz/lub zapoznanie się z wynikami ciekawego badania (choć naszym skromnym zdaniem przeprowadzonym w nienajlepszy sposób)

Hoekstra, R., R. D. Morey, J. N. Rouder, E-J. Wagenmakers, 2014. Robust misinterpretation of confidence intervals. Psychonomic Bulletin Review, w druku.

Metodolog.pl – biznes

Analiza statystyczna, pomoc, usługi analityczne