Testowanie hipotez w statystyce – Podejmowanie inteligentnych decyzji w biznesie i nauce.
Case study.
Powiedzmy, że średnie oceny z matematyki dla 3 klasy gimnazjum wynoszą 85 punktów. Z drugiej strony jeśli losowo wybierzemy 30 uczniów i policzymy ich średni wynik to okaże się, że ich średni wynik wynosi 95. Co można wywnioskować z tego eksperymentu ? Jest to bardzo proste ! Oto wnioski 🙂
– Te 30 osób różni się punktacją od populacji 3 klasistów. Ich wyniki są wyższe i są to dwie różne populacje.
– Nie ma żadnej różnicy. Rezultat jest tylko przypadkowy i jest to kwestia losu, że w tej grupie znalazło się akurat tyle osób, że uzyskano średni wynik wynoszący 85.
Jak powinniśmy zdecydować które wyjaśnienie jest poprawne ? Istnieją różne metody, które pomagają podjąć tę decyzję. Oto kilka opcji:
– zwiększenie liczebności próby
– przetestowanie innej próby
– obliczenie losowego prawdopodobieństwa szansy
Dwie pierwsze metody wymagają poświęcenia większej ilości czasu i pieniędzy. W związku z tym, nie jest pożądane kiedy budżet i czas są ograniczone.
Tak więc, w takich przypadkach wygodną metodą jest obliczenie prawdopodobieństwa losowości dla tej próbki. Czyli tego czy jest prawdopodobne, że próbka będzie miała średni wynik 95 ? Takie podejście pomoże Tobie w wyciągnięciu wniosków z danych dwóch powyższych hipotez.
Nasuwa się teraz pytanie ” Jak należy obliczyć losowość tego wyniku ? ” Aby na to odpowiedzieć, należy najpierw przejrzeć podstawy rozumienia statystyki.
Wartość-Z, Wartość – p: Wartość Z jest miarą odchylenia standardowego, czyli jak daleko od średniej jest obserwowana wartość. Dla przykładu wartość Z wynosi +1,8 może być interpretowana jako to, że obserwowana wartość jest oddalona od średniej o 1,8 odchylenia standardowego. Wartość p jest prawdopodobieństwem. Obie te statystyki są powiązane ze standardowym rozkładem normalnym. Możesz spojrzeć na wartości p powiązanych z każdą wartością Z w tabelach statystycznych Z. A to jest wzór do obliczenia wartości Z.
Z=(X-µ) / σ – gdzie X jest wartością obserwacji, µ jest średnią z populacji a σ to odchylenie standardowe z populacji.
Jak już wspomniano wcześniej, te metody zawsze działają z rozkładem normalnym ( zdjęcie poniżej ) Tylko i wyłącznie z normalnym ! Nie z innym rozkładem ( chyba, że symetrycznym). W przypadku kiedy rozkład wyników nie jest normalny, nie można odnosić się do teorii centralnego twierdzenia granicznego.
Rozkład normalny i rozkład paranormalny.
Centralne Twierdzenie graniczne jest bardzo ważne w statystyce. Nie wdając się w definicje wyjaśnię to używając przykładu. Mamy dane 1000 studentów 5 klasy. Mamy tu dwa kluczowe wskaźniki tej populacji, czyli średnią równą 48,4 oraz odchylenie standardowe 29,1. Teraz weźmy próbkę 40 studentów z tej populacji. Więc jak dużo próbek możemy pobrać z tej populacji ? Możemy pobrać 25 próbek (1000/40=25). Czy można powiedzieć, że każda z wylosowanych próbek będzie miała takie same średnie jak cała populacja 48,4 ? Takie ideolo jest pożądane, lecz praktycznie jest nieprawdopodobne by każda próbka miała taką samą średnią.
1. Średnia z próbek ( 1000 ) jest bardzo zbliżona do średniej w populacji.
2. Odchylenie standardowe rozkładu próbek może być określane z odchylenia standardowego populacji podzielonego przez pierwiastek kwadratowy z wielkości próbki N. Jest to znane też jako błąd standardowy średniej.
3. Rozkład z próbki jest normalny bez względu na rozkład będący w populacji. Jest to znane jako Centralne Twierdzenie Graniczne. We wstępnym przykładzie uczniów gimbazy, porównywaliśmy średnią z próbki ze średnią w populacji przy czym była to odległość między średnią z populacji a średnią z próbki. W takim przypadku zawsze można skorzystać we wnioskowaniu z właściwości rozkładu normalnego bez martwienia się o rozkład wyników w populacji.
Można wyliczyć odchylenie standardowe i średnią bazując na powyższych ustaleniach i policzyć wartość Z oraz wartość p. Tutaj prawdopodobieństwo pomoże nam zaakceptować jeden z dyskutowanych wniosków dotyczących uczniów gimbazy. Niemniej jednak, aby zaspokoić Centralne twierdzenie graniczne wielkość próbki musi być wystarczająca ( średnia jaką podaje literatura dla minimalnej liczebności próbki wynosi około N>=30).
Teraz powiedzmy sobie jedno. Musimy obliczyć prawdopodobieństwo. Poziom istotności pomoże nam podjąć decyzję o przyjęciu którejś z dwóch hipotez.
Podjęliśmy założenie, że prawdopodobieństwo uzyskania średniej wynoszącej 95 z próbki wynosi 40%. Jest bardziej prawdopodobne to, że o takim wyniku można powiedzieć, że istnieje większa szansa uzyskania go przez przypadek a nie z powodu różnic w zachowaniu lub innego wpływu.
Gdybyśmy mieli prawdopodobieństwo wynoszące 7%, nie było by możliwości o tym, że taki wynik jest przypadkowy. Tutaj już mogą występować pewne różnice w zachowaniu ponieważ prawdopodobieństwo jest relatywnie niskie. To co znaczy, że jest wysokie prawdopodobieństwo prowadzi do akceptacji przypadkowości, a niskie prawdopodobieństwo prowadzi do wnioskowania o np. różnicach w zachowaniu ( lub jakichkolwiek różnicach pod względem jakiegokolwiek parametru).
W jaki sposób teraz mamy zdecydować jakie jest wysokie i jakie jest niskie prawdopodobieństwo ?
Szczerze mówiąc, jest to dosyć subiektywne, ale bazuje na rozsądnych podstawach. Możemy mieć kilka scenariuszy w biznesie, gdzie 90% jest uważane za wysokie prawdopodobieństwo, a w innym przypadku, gdzie wymaga się większej pewności wynik ten wynosi 99%. Generalnie w większości dziedzin punkt odcięcia wynosi 5%. Te 5% nazywa się poziomem istotności lub znane jest też jako poziom Alfa ( co symbolizuje α). Oznacza to, że jeżeli prawdopodobieństwo jest mniejsze niż 5% to możemy wnioskować o tym że jest różnica w wynikach pomiędzy dwiema populacjami. 1 – poziom istotności jest znany także jako poziom ufności co znaczy, że z 95% prawdopodobieństem różnica ta nie jest przypadkowa.
Poniżej są pokazane najczęściej przyjmowane w nauce i biznesie poziomy istotności/Alfa
Do tej pory patrzyliśliśmy na to jako narzędzie do testowania hipotezy czy średnia z próbki różni się istotnie od średniej z populacji. Teraz, pójdźmy krok po kroku aby przetestować hipotezę testem statystycznym.
Jakie kroki prowadzą do testowania hipotezy ?
1). Postaw hipotezy (zerową i alternatywną): W wyżej opisywanym przykładzie gimbazy tak naprawdę testowaliśmy hipotezę. Hipotezę tą, testowaliśmy jako to czy różnica pomiędzy uzyskaną próbką a populacją jest losowa. Tak naprawdę testowaliśmy hipotezę zerową, która zakłada że nie ma istotnej różnicy pomiędzy próbką a populacją. Symbol hipotezy zerowej to „H0”. Należy pamiętać, że dlatego testujemy hipotezę zerową, bo mamy wątpliwości co do jej prawdziwości :). Dlatego stawiamy hipotezę alternatywną.
2) Dla przykładu z gimbusami hipotezą alternatywną jest to, że jest znaczna i istotna różnica pomiędzy populacją a próbką. Hipotezę alternatywną oznacza symbol „H1”. W sądzie również zakłada się, że oskarżony jest niewinny ( to jest taka hipoteza zerowa dla oskarżonego). Dlatego prokurator jest obciążony próbą pokazania dowodów, które świadczą o tym, że oskarżony nie jest niewinny. Trochę to dziwne, ale koniec końców jest bardzo rozsądne :). Podobnie w statystyce, zakłada się że hipoteza zerowa jest prawdziwa obciążając badacza przeprowadzeniem badania w celu pokazania dowodów, że hipoteza zerowa jest nieprawdopodobna i nie jest prawdziwa.
3) Ustawienie kryteriów decyzji. By ustalić kryteria dla decyzji musimy stwierdzić jakiś poziom istotności dla testu. Może to być np. 5%, 1% lub 0,5%. Bazując na poziomie istotności, podejmujemy decyzję o akceptacji hipotezy zerowej lub alternatywnej.
4) Obliczamy prawdopodobieństwo losowości. Test statystyczny pomaga nam to określić. Mniejsze prawdopodobieństwo jest niewystarczającą ilością dowodów by zaakceptować hipotezę zerową.
5) Podejmujemy decyzję. Wartość p porównujemy z góry określonym poziomem istotności oraz jeśli jest ona mniejsza niż poziom istotności to odrzucamy hipotezę zerową. Podczas podejmowania decyzji o odrzuceniu hipotezy zerowej coś może pójść źle, ponieważ decyzji nie podejmujemy w oparciu o populację ale w oparciu o próbkę. Istnieją cztery alternatywy dotyczące prawdy i fałszu decyzji podjętej w stosunku hipotezy zerowej.
1. Decyzja o utrzymaniu hipotezy zerowej jest prawdziwa.
2. Decyzja o utrzymaniu hipotezy zerowej jest nieprawdziwa ( jest to błąd 2 rodzaju). – Badanie idzie do kosza.
3. Decyzja o odrzuceniu hipotezy zerowej jest prawdziwa.
4. Decyzja o odrzuceniu hipotezy zerowej jest nieprawdziwa ( jest to błąd 1 rodzaju). – tworzymy nieprawdziwy artefakt
Przykład !
Poziom glukozy u otyłych pacjentów, powiedzmy, że wynosi średnio 100 przy odchyleniu standardowym równym 15. Eksperymentator uważa, że dieta bogata w surową skrobię kukurydzianą będzie miała pozytywny wpływ na ów poziom glukozy. Próbka 36 pacjentów, która próbowała tej diety miała średni poziom glukozy wynoszący 108. Testowanie hipotezy dotyczy tego czy dieta ta ma efekt lub go nie ma.
Rozwiązanie – Podążaj za podpunktami by przetestować tę hipotezę.
Krok 1. Postaw hipotezy. Próba w populacji równa się 100.
H0: μ= 100
H1: μ > 100
Krok 2. Przyjmij poziom istotności. Nie jest to podane w zadaniu więc przyjmijmy 5% ( 0,05).
Krok 3. Oblicz prawdopodobieństwo losowości używając punktacji Z z tabeli wartości Z.
Wzór Z
Z=(108-100)/ (15/√36)=3.20
Możesz zobaczyć prawdopodobieństwo poprzez zobaczenie tabeli wartości Z i powiązanych z nimi wartości p przy wyniki 3.20. Okazuje się, że prawdopodobieństwo wartości mniejszej niż 108 wynosi 0,9993, a większe bądź równe 108 wynosi (1-0,9993)=0,0007.
Krok 4. Wartość ta jest mniejsza niż 0,05, więc odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną. Czyli ? Czyli dieta z surowej skrobi kukurydzianej ma istotny ( czyli nieprzypadkowy) wpływ na poziom glukozy :).
Kierunkowe i niekierunkowej testowanie hipotez.
W poprzednim przykładzie nasza zerowa hipoteza była taka, która nie twierdziła, że były różnice pomiędzy średnimi. Alternatywna była taka, że średnia z próbki była wyższa niż 100. Niemniej jednak, możemy postawić hipotezę alternatywną jako taką, że średnia z próbki nie jest równa 100. To staje się ważne kiedy odrzucamy hipotezę zerową. Mamy dwa przykłady hipotezy alternatywnej.
– Średnia z próbki jest większa niż 100
– Średnia z próbki nie jest równa 100.
Tutaj pytaniem jest ” Która hipoteza alternatywna jest bardziej dopasowana?”. Istnieją pewne wskazówki, które pomagają podjąć tą decyzję.
np.
– Nie jesteś zainteresowany testowaniem średniej mniejszej niż 100, chcesz testować tylko wyższą (lub niższą) wartość.
– Masz silne przeczucia/ lub podstawy teoretyczne do wnioskowania o tym, że skrobia ma wpływ na zwiększenie wyników.
W powyższych dwóch przykładach będziemy używać testu jednostronnego ( One tail test np. α=0,025). W jednym ogonie, nasza alternatywna hipoteza dotyczy tego, że obserwacja jest większa bądź mniejsza niż obserwowana średnia z populacji. Taki sposób konstruowania przewidywań nazywa się hipotezą kierunkową. Z drugiej strony, jeśli nie wiesz jaki skutek będzie mieć manipulacja eksperymentalna skrobią to stawiasz hipotezę bezkierunkową i używasz do tej weryfikacji testu dwustronnego (two tail test np. α=0,05).
Np. Powiedzmy, że jedna z agencji badawczych wymyśla nową metodę nauczania. Chcą oni sprawdzić wpływ tej metody. Nie są oni jednak świadomi czy ta metoda ma lepszy czy gorszy wpływ na nauczanie. W takich przypadkach jak ten, powinno testować się hipotezę bezkierunkową statystycznym testem dwustronnym.
W teście jednostronnym, odrzucamy hipotezę zerową jeśli średnia z próbki jest wyraźnie niższa bądź wyższa. W przypadku testu dwustronnego możemy odrzucać hipotezę zerową w każdą ze stron ( niżej i wyżej ).
Nota końcowa.
W tym wątku podjęto się przyjrzeniu całemu procesowi podejmowania się testowania hipotez podczas modelowania predykcyjnego. Początkowo zapoznaliśmy się z koncepcją stawiania hipotez i sposobami ich weryfikacji by podejmować świadome decyzje. Ponad to również zobaczyliśmy ważne koncepcje testowania hipotez takie jak wartość Z, tabele Z, wartość P oraz Centralne Twierdzenie Graniczne.
Ta koncepcja zmienia myślenie o podejmowaniu inteligentnych i trafnych decyzji. Jeśli chcesz mieć mocne wsparcie przy podejmowaniu decyzji ta metoda statystyczna powinna być drugą rzeczą jaką zrobisz. Pierwszą oczywiście będzie opracowanie poprawnej i wiarygodnej metody zebrania wyników wejściowych do analizy.
6 thoughts on “Testowanie hipotez w statystyce – Podejmowanie inteligentnych decyzji w biznesie i nauce.”
Comments are closed.