TESTIRANJE HIPOTEZE
PRINCIPI TESTIRANJA HIPOTEZE Svrha epidemioloških studija je istražiti postoji li POVEZANOST između varijable od interesa i pojedinog ishoda. Kada dizajniramo kliničke pokuse želimo pokazati je li eksperimentalna terapija EFIKASNIJA OD STANDARDNE TERAPIJE ILI PLACEBA. (Eksperimentalna terapija mora biti efikasnija za neki MINIMALNI IZNOS, ODREĐEN na temelju KLINIČKE PRAKSE.)
PRINCIPI TESTIRANJA HIPOTEZE Što testiramo? Učinci ili razlike koje su nam interesantne Razlike u aritmetičkoj sredini ili proporcijama Omjer izgleda (OR) Relativni Rizik (RR) Korelacijski koeficijent povezanost dvaju varijabli Medicina: uglavnom usporedba aritmetičkih sredina između 2 skupina
PRINCIPI TESTIRANJA HIPOTEZE Što testiramo? KLINIČKI ZNAČAJNA RAZLIKA Najmanja razlika koja je biološki ili klinički relevantna Npr razlika od 2 M glukoze ili 0.2 M glukoze?
Nulta hipoteza = ništična hipoteza izjava o stvarnim populacijskim parametrima koji se istražuju; µ 1 =µ 2 Alternativna hipoteza-hipoteza različita od nulte µ 1 µ 2
Nulta hipoteza = ništična hipoteza izjava o stvarnim populacijskim parametrima koji se istražuju; µ 1 >=µ 2 Alternativna hipoteza- hipoteza različita od nulte µ 1 <µ 2
PRINCIPI TESTIRANJA HIPOTEZE Rezultat testiranja hipoteze je broj koji nazivamo P vrijednost P-vrijednost je VJEROJATNOST da ćemo dobiti toliko velike razlike ili još veće razlike između skupina SLUČAJNO P=0.01=1% P=0.78=78% P=0.05=5% Na temelju P-vrijednosti možemo prihvatiti ili odbaciti ništičnu hipotezu
Testiranje hipoteze P vrijednost Manja od 0,05 (ili 0,01) P<0,05 P NS. P=0,021 P<0,001 P=3,45*10-5
Odabir testa Zavisne ili nezavisne skupine Tipu varijable koju testiramo Broju skupina koje testiramo
Kvalitativni (kategorijski) 1 neovisna varijabla 2 ili više neovisnih varijabli 2 ili više ovisnih varijabli Goodness of fit x 2 Hi kvadrat (x 2 ) McNemar test Pearson r Kontinuirana varijabla Regresija TIP PODATKA Povezanost 1 prediktor Više prediktora neovisne Rangovi Multipla regresija t test Mann-Whitney Spearman r Testiranje hipoteze Kvantitativni Razlika 2 skupine ovisne t test za povezane uzorke Wilcoxon One-way ANOVA Kruskal-Wallis neovisne Parametrijske Više skupina ANOVA za ponavljane uzorke Neparametrijske ovisne Friedman
Zadatak Opisima istraživanja (1-5) pridružite odgovarajući statistički test (A-E): Mogućnosti A. analiza varijance (ANOVA) B. χ2-test za 3 2 tablicu podataka C. t-test za nepovezane uzorke D. t-test za povezane uzorke E. χ2-test za 2 2 tablicu podataka 1. Djelovanje novoga lijeka za snižavanje krvnoga tlaka u ukriženom se pokusu uspoređuje s djelovanjem placeba
Zadatak Opisima istraživanja (1-5) pridružite odgovarajući statistički test (A-E): Mogućnosti A. analiza varijance (ANOVA) B. χ2-test za 3 2 tablicu podataka C. t-test za nepovezane uzorke D. t-test za povezane uzorke E. χ2-test za 2 2 tablicu podataka 2. Postoji li veći rizik oboljenja od karcinoma dojke u žena koje rabe hormonsku kontracepciju u odnosu na one koje to ne čine?
Zadatak 7. Opisima istraživanja (1-5) pridružite odgovarajući statistički test (A-E): Mogućnosti A. analiza varijance (ANOVA) B. χ2-test za 3 2 tablicu podataka C. t-test za nepovezane uzorke D. t-test za povezane uzorke E. χ2-test za 2 2 tablicu podataka 3. Razlikuju li se proporcije pušača u Francuskoj, Velikoj Britaniji i Njemačkoj?
Zadatak 7. Opisima istraživanja (1-5) pridružite odgovarajući statistički test (A-E): Mogućnosti A. analiza varijance (ANOVA) B. χ2-test za 3 2 tablicu podataka C. t-test za nepovezane uzorke D. t-test za povezane uzorke E. χ2-test za 2 2 tablicu podataka 4. Je li prosječna vrijednost indeksa tjelesne mase (BMI) petnaestogodišnjaka u Škotskoj veća od istoga indeksa petnaestogodišnjaka u Engleskoj?
Zadatak 7. Opisima istraživanja (1-5) pridružite odgovarajući statistički test (A-E): Mogućnosti A. analiza varijance (ANOVA) B. χ2-test za 3 2 tablicu podataka C. t-test za nepovezane uzorke D. t-test za povezane uzorke E. χ2-test za 2 2 tablicu podataka Usporedba djelovanja triju različitih lijekova u bolesnika s hiperkolesterolemijom, pri čemu su skupine ispitanika razdijeljene u podskupine s prosječnom razinom kolesterola.
Zadatak Poredajte postupke testiranja hipoteze u pravilan redoslijed: A. tumačenje P-vrijednosti B. statistički izračun C. postavljanje ništične i alternativne hipoteze D. prikupljanje odgovarajućih podataka E. očitavanje P-vrijednosti iz odgovarajuće krivulje raspodjele vjerojatnosti.
Zadatak Novi model liječenja karcinoma dojke pokazuje poboljšanje stope izlječenja. Proporcija žena koje prežive dvije godine nakon početka liječenja veća je uz primjenu novoga lijeka, u odnosu na lijek rabljen tijekom prethodnoga dvogodišnjega razdoblja: χ2 = 4,2, broj stupnjeva slobode (df) = 1, P < 0,05. A. Vjerojatnost dobivanja takve razlike proporcija izlječenja manja je od jednom u 20 slučajeva, uz uvjet da nema stvarne razlike u djelovanju lijekova. B. Poboljšanje ishoda liječenja je statistički značajno. C. Bolji rezultat liječenja može biti posljedica utjecaja zbunjujućeg čimbenika.
Povezanost varijabli Kvantitativne koeficijent korelacije Kvalitativne - χ2 test, McNemar - omjer izgleda, relativni rizik
KVANTITATIVNE Točkasti graf za usporedbu 2 varijable Citat iz rada: Scatter plot, showing the strong association between enzyme activity at ph 5.5 and the 5α-reductase 2-specific mrna expression, as expressed on the basis of β-actin (n = 30; r s = 0.81; 95% confidence interval, 0.64 0.91; P < 0.0001).
Obrasci na točkastom grafikonu Linearnost i Smjer su dva koncepta koja nas interesiraju Pozitiva linearna ovisnost Negativna linarna ovisnoat Slaba ili ne-linearna ovisnost Nema ovisnosti
(n = 30; r s = 0.81; 95% confidence interval, 0.64 0.91; P < 0.0001) Citat iz rada: Scatter plot, showing the strong association between enzyme activity at ph 5.5 and the 5α-reductase 2-specific mrna expression, as expressed on the basis of β-actin (n = 30; r s = 0.81; 95% confidence interval, 0.64 0.91; P < 0.0001).
Kvalitativne varijable Tablice frekvencija Za usporedbu 2 kategorijske varijable Ako prva varijabla ima r kategorija, druga varijabla c kategorija, tada izrađujemo tablicu frekvencija r c (cross table).
YPEL5 Genotype Frequency Povezanost kvalitativnih varijabli Disease X YES NO TOTAL AA 2 0 2 AB 1 3 4 BB 0 4 4 TOTAL 3 7 10 4 3 2 1 0 AA AB BB Disease Healthy
χ2 = 4,2, broj stupnjeva slobode (df) = 1, P < 0,05. Novi model liječenja karcinoma dojke pokazuje poboljšanje stope izlječenja. Proporcija žena koje prežive dvije godine nakon početka liječenja veća je uz primjenu novoga lijeka, u odnosu na lijek rabljen tijekom prethodnoga dvogodišnjega razdoblja: χ2 = 4,2, broj stupnjeva slobode (df) = 1, P < 0,05.
Zadatak Pokušajte odrediti ovisi li rezultat atletičara na 100 m o godini u kojoj je postigao rezultat? Kako to objašnjavate? Podatke možete naći na http://www.mefst.hr/default.aspx?id=1772
Mjere povezanosti ᵪ2 test odgovara na pitanje "Ima li povezanosti?" Odgovor na pitanje Koliko je jaka povezanost? daju nam mjere za snagu povezanosti kao što je npr. razlika u proporcijama, omjer izgleda, relativni rizik
Primjer: Mišljenje o radu George W. Busha kao predsjednika (08/09 Gallupova anketa) Mišljenje (n=1000) Stranka Odobrava Nedobrava Demokrati 3% 97% Republicanci 64% 36% Rod Odobrava Nedobrava Žene 24% 76% Muškarci 27% 73% Razlika u proporcijama 0.64 0.03 = 0.61 ukazuje na puno jaču povezanost između političke stranke i mišljenja od povezanosti spola i mišljenja 0.27 0.24 = 0.03
Povezanost prihoda i sreće Happiness Prihod Vrlo Uglavnom Ne baš Iznad 272 (44%) 294 (48%) 49 (8%) Prosjek 454 (32%) 835 (59%) 131 (9%) Ispod 185 (20%) 527 (57%) 208 (23%)
Usporedba s omjerima Relativni rizik Omjer proporcija također može biti koristan ("relativni rizik") Primjer: Usporedba proporcije one koji se izjašnjavaju kao vrlo sretni i s primanjima iznad prosječnog dohotka s vrlo sretnima čija su primanja ispod prosjeka, 0.44/0.20 = 2.2
Usporedba s omjerima omjer izgleda Alternativna mjera za usporedbu proporcija, koja se obično koristi u modelima logističke regresije za kategoričke varijable, je omjer izgleda.
Izgled Za dva ishoda ( uspjeh, neuspjeh ) u skupini, Izgled /ODDS = P(uspjeh)/P(neuspjeha) = P(uspjeh)/[1 - P(neuspjeh)] npr., ako je P(uspjeh) = 0.80, P(neuspjeh) = 0.20, Izgled = 0.80/0.20 = 4.0 ako P(uspjeh) = 0.20, P(neuspjeh) = 0.80, Izgled = 0.20/0.80 = ¼ = 0.25 Vjerojatnost uspjeha na temelju OR Vjerojatnost = Izgled/(Izgled + 1) Npr. Izgled = 4.0 odgovara vjerojatnosti = 4/(4+1) = 4/5 = 0.80
Omjer izgleda omjer izgleda = (izgled u 1. redu)/(izgled u 2. redu) Example: Upitnik za srednjoškolce Alkohol Pušenje DA NE DA 1449 46 NE 500 281 2 = 451.4, df = 1 (P-value = 0.000001) Izgled za pijenje alkohola u skupini koja puši =1449/46 = 31.50 Izgled za pijenje alkohola u skupini ne puši 500/281 = 1.78 Omjer izgleda 31.5/1.78 = 17.7 Relativni rizik (1449/1495)/(500/781)=1.5
Zadatak Koje od navedenih vrijednosti su mjera jakosti povezanosti? a. omjer izgleda b. standardna devijacija c. raspon pouzdanosti d. koeficijent korelacije e. P-vrijednost ᵪ2 testa
Zadatak U studiji parova ispitivana je povezanost između pojave zloćudne novotvorine mokraćnoga mjehura i pušenja: 145 ispitanika sa zloćudnom novotvorinom mokraćnoga mjehura: 87 pušača i 58 nepušača 178 ispitanika u kontrolnoj skupini (nemaju zloćudnu novotvorinu mokraćnog mjehura): 62 pušača i 116 nepušača Izračunajte omjer izgleda za povezanost pušenja i pojave zloćudne novotvorine mokraćnoga mjehura.
Zadatak Protumačite slijedeći graf
KVANTITATIVNE Točkasti graf za usporedbu 2 varijable Primjer 2 Citat iz rada: Squamous cell carcinoma tumor and perilesional display distinctly different scatter plots from normal tissue. Expresion levels for gene subset 1 in patient 1
Confidence interval