Statistical methods for detecting genotype-phenotype association in case-control studies

Prosjektnummer: 46056703
Ansvarlig person: Kari Krizak Halle
Institusjon: NTNU, IME Fak
Prosjektkategori: phd-stipend 2013
Helsekategori: Generic Health Relevance
Forskningsaktivitet: 4. Detection and Diagnosis

2016 - sluttrapport

Hvilke genetiske komponenter har schizofreni? Hvorfor har noen bedre maksimalt oksygenopptak enn andre selv med samme treningsbakgrunn? Man kan få noen svar på slike spørsmål ved å studere sammenhenger mellom genetiske markører og en egenskap/fenotype (for eksempel syk/frisk, maksimalt oksygenopptak eller BMI). I praksis kan en slik sammenheng studeres ved å tilpasse en regresjonsmodell. I regresjonsmodellen inkluderer vi faktorer som kan påvirke fenotypen, for eksempel kjønn, alder, kosthold og trening sammen med de genetiske markørene. En sammenheng mellom en eller flere genetiske markører og fenotypen kan avdekkes ved bruk av regresjonsmodellen og en statistisk test. Vi har brukt denne tankegangen i for eksempel genome-wide assosiasjonsstudier (GWAS) der opptil flere millioner genetiske markører undersøkes med tanke på sammenheng med en gitt fenotype. Når så mange genetiske markører undersøkes, vil man oppdage mange tilsynelatende sammenhenger som bare skyldes rene tilfeldigheter i datamaterialet. Man må derfor ha strenge regler for å konstatere at sammenhenger virkelig eksisterer. Dette kalles å korrigere for multippel testing. Det finnes velkjent statistisk teori for å håndtere dette, men disse metodene tar ikke hensyn til i hvilken grad genetiske markører arves sammen, og er derfor unødig strenge slik at for få sanne sammenhenger oppdages. Andre kjente metoder krever store datamaskinressurser og kan derfor i praksis ikke brukes for å analysere data fra GWAS, der antall genetiske markører kan være flere millioner og antall personer kan være flere tusen. I doktorgradsprosjektet mitt har jeg utviklet en statistisk metode som gir et mindre strengt kriterium, men samtidig kontroll over sannsynligheten for falske funn. Vår metode tar hensyn til samvariasjon mellom de genetiske markørene og er effektiv, det vil si at den krever mindre datamaskinressurser enn med andre metoder. Vi har brukt vår metode til å analysere data fra HUNT-studien i samarbeid med forsker Anja Bye ved CERG/NTNU og data fra TOP-studien ved UiO i samarbeid med professor dr.med. Ole Andreas Andreassen. Fokuset for doktorgradsprosjektet har vært statistisk metodeutvikling og prosjektet har resultert i tre manuskripter som inngår i min PhD avhandling: 1. Efficient and powerful familywise error control in genome-wide association studies using generalized linear models 2. Permutation in genetic association studies with covariates: controlling the familywise error rate with score tests in generalized linear models 3. Is the familywise error rate in genomics controlled by methods based on the effective number of independent tests? I den første artikkelen presenterer vi den nye metoden for å korrigere for multippel testing. Vår metode kontrollerer sannsynligheten for minst ett falskt positivt funn (familywise error rate) på ønsket nivå og er basert på generaliserte lineære modeller og såkalte score tester og nyttiggjør seg av korrelasjonen mellom de statistiske testene som utføres. Den andre artikkelen i avhandlingen er en review-artikkel der vi sammenligner permuteringsmetoder for regresjonsmodeller. Den tredje artikkelen i avhandlingen diskuterer konseptet <>, som er blitt brukt for å korrigere for multippel testing i GWAS. I denne artikkelen sammenligner vi vår metode med flere eksisterende metoder og viser ved simuleringer at disse metodene generelt ikke kontrollerer familywise error rate på ønsket nivå. Ingen konsekvenser for helsetjenesten.

2015

Statistiske metoder for multippel testing: Hvordan kontrollere sannsynligheten for falske positive funn?I genetiske assosiasjonsstudier studeres en sykdom og et stor antall genetiske markører, der målet er å finne ut om noen markører påvirker sykdommen. I slike studier er det viktig å kontrollere sannsynligheten for minst ett falskt positive funn. Vi har utviklet en ny metode for dette og har brukt metoden på data fra Universitetet i Oslo og NTNU.Målet med genome-wide association (GWA) studier er å undersøke om noen genetiske markører påvirker fenotypen vi studerer. Siden antallet genetiske markører kan være flere hundre tusen er det viktig å kunne kontrollere sannsynligheten for falske positive funn. Det er også viktig å kunne ta hensyn til andre faktorer som påvirker fenotypen, f.eks. alder eller kjønn. For hver markør i en GWA-studie utføres en statistisk test for sammenhengen mellom den genetiske markøren og fenotypen vi studerer. Resultatet presenteres ofte som en p-verdi, og en lav p-verdi kan tolkes som en indikasjon på en mulig sammenheng mellom den genetiske markøren og fenotypen. I GWA studier vil vi ha opptil flere hundre tusen slike p-verdier og mange vil være lave ved rene tilfeldigheter, uten at det er noen reell sammenheng mellom den genetiske markøren og fenotypen. Det kan gi mange falske positive funn. Vi har sett på metoder som kontrollerer family-wise error rate (FWER), som er sannsynligheten for å få minst ett falskt positivt funn. Målet med multippel testing er å finne en så høy terskelverdi som mulig for p-verdien. En høy terskelverdi betyr at vi får flere funn samtidig som vi kontrollerer den totale sannsynligheten for falske positive funn. Ett av datasettene vi studerer i dette prosjektet er fra K. G. Jebsen senter for psykoseforskning ved Universitetet i Oslo, (http://www.med.uio.no/klinmed/forskning/sentre/kgj-psykoseforskning/), der personene i datasettet enten har bipolar lidelse eller schizofreni eller de ikke har en slik sykdom. Datasettet vi analyserer inneholder informasjon om 700 000 genetiske markører for rundt 1500 personer. Vår metode blir også anvendt på data fra forskningsgruppen CERG ved NTNU (http://www.ntnu.no/cerg). Dette datasettet inneholder informasjon om 120000 genetiske markører fra 2800 personer og personenes maksimale oksygenopptak. I tillegg har vi data for alder, kjønn og fysisk aktivitetsnivå. Det finnes generelle regler for hvor lav p-verdi-terskelen bør være når vi gjør et stort antall tester, hvis vi krever maksimalt 5 % sannsynlighet for minst ett falskt positivt funn. Disse reglene (for eksempel Bonferroni korreksjon) tar ikke hensyn til hvordan avhengighetsstrukturen i dataene er, og en slik regel vil være veldig streng, det vil si at terskelverdien vil være veldig lav. Vi har utviklet en ny metode for å finne terskelverdien samtidig som vi kontrollerer den totale sannsynligheten for falske positive funn. Vi jobber nå med å skrive ferdig en artikkel om denne metoden. I vår metode utfører vi for hver genetisk markør en score test og utnytter avhengighetsstrukturen mellom testene for å estimere terskelverdien. Det finnes andre metoder der man bruker permutering for å utnytte avhengighetsstrukturen i dataene til å finne en mindre streng terskelverdi. Disse metodene krever store datamaskinressurser, er veldig tidkrevende og gyldigheten til metodene er avhengig av om antagelsen om ”exchangeability” er oppfylt. Generelt er ikke antagelsen oppfylt dersom modellen også inneholder andre faktorer (f.eks. alder og kjønn). Vi jobber nå med en artikkel der vi sammenligner flere permuteringsmetoder. Vi har vist at vår metode har større styrke (høyere terskelverdi) enn den mest kjente metoden for multippel testing (Bonferroni korreksjon), og sammenlignet med andre metoder kontrollerer vår metode sannsynligheten for falske positive funn på ønsket nivå, samt at den krever mindre datamaskinressurser enn permuteringsmetoder.

2014

Statistiske metoder for multippel testing: Hvordan kontrollere sannsynligheten for falske positive funn?I en "genome-wide association study" undersøkes om noen av opptil flere hundre tusen genotyper påvirker en fenotype. Vi har utviklet en ny metode for å korrigere for multippel testing, som kontrollerer sannsynligheten for falske positive funn. Metoden blir anvendt på data fra to K. G. Jebsen-senter i Norge (NORMENT ved UiO og CERG ved NTNU).I genome-wide association studies (GWA-studier) innhentes informasjon om hundretusener av genetiske markører for et stort antall personer. Målet er å finne markører som har sammenheng med en fenotype (som sykdomsstatus eller oksygenopptak). Vi har utviklet en metode for dette, som også gir kontroll på sannsynligheten for falske funn, og som kan korrigere for kovariater (andre faktorer som kan påvirke fenotypen, som alder, kjønn, røyking, kosthold og fysisk form). For hver markør i en GWA-studie utføres en statistisk test for slik sammenheng. Testen gir en p-verdi, og lav p-verdi indikerer sammenheng. En GWA-studie gir hundretusener av p-verdier. Mange er lave ved rene tilfeldigheter, uten at det er noen reell sammenheng mellom markør og fenotype. Ved slik multippel testing ønsker man å finne en terskelverdi for hvor lav en p-verdi må være for at resultatet skal regnes som et funn, samtidig som man med stor trygghet skal unngå falske funn. Terskelen skal være høyest mulig (for å få flere funn), men samtidig så lav at sannsynligheten for å få minst ett falskt funn, family-wise error rate (FWER), ikke overstiger en valgt verdi (vanligvis 5 %). Det finnes generelle regler for hvor lav terskelen bør være ved en gitt grense for FWER. En slik regel tar ikke hensyn til at to markører ofte arves sammen, og dermed gir avhengighet mellom de to testene. Den må være streng (gi en lav terskel, f.eks. 0.00000005), fordi den også må fungere når alle markørene arves uavhengig av hverandre. Vi arbeider med å finne effektive metoder som gir en så høy som mulig terskel i GWA-studier samtidig som FWER kontrolleres. Vi tar utgangspunkt i en metode utviklet av Moskvina og Schmidt (2008) for såkalte alleliske tester. Dickhaus og Stange (2013) utvidet metoden til bialleliske data. Vår metode omfatter en større klasse av statistiske tester, og tar også hensyn til kovariater. Felles for alle tre metoder er utnyttelse av avhengighetsstrukturen mellom testene for de ulike markørene. TOP-studien ved K.G. Jebsen-senter for psykoseforskning ved Universitetet i Oslo (http://www.med.uio.no/klinmed/forskning/sentre/kgj-psykoseforskning/) gir informasjon om 700 000 genetiske markører for rundt 450 personer med bipolar lidelse eller schizofreni og 1100 uten slik sykdom. Vi anvender metoden vår med binær fenotype (syk/frisk) og en såkalt score-test i logistisk regresjon som testmetode. Data fra forskningsgruppen CERG ved K.G. Jebsen-senter for hjertetrening ved NTNU (http://www.ntnu.no/cerg) gir informasjon om 120 000 markører for 2800 personer fra Helseundersøkelsen i Nord-Trøndelag (http://www.ntnu.no/hunt/) og Generasjon 100-prosjektet ved CERG. Vi anvender metoden vår med kontinuerlig fenotype (maksimalt oksygenopptak) og score-test i multippel regresjon som inkluderer kovariater. Vår metode gir høyere terskelverdi (større teststyrke) enn den mest kjente generelle regelen for multippel testing (Bonferroni-korreksjon), og den gir konsistent kontroll av FWER. Vi er nå i ferd med å sluttføre arbeidet med å skrive en artikkel om denne metoden. Artikkelen vil bli sendt til et statistisk tidsskrift for publisering. Kilder: Moskvina og Schmidt (2008): On multiple-testing correction in cenome-wide association studies, genetic epidemiology (32), s. 567–573 Dickhaus og Stange (2014): Multiple point hypothesis test problems and effective numbers of tests for control of the family-wise error rate, Calcutta Statistical Association Bulletin (65), nr. 257–260, s. 123–144

2013

Statistiske metoder for multippel testing: Hvordan effektivt begrense sannsynligheten for falske positive funn?I genetiske assosiasjonsstudier studeres en fenotype, det kan være tilstedeværelse eller fravær av en sykdom, og en eller flere genetisk markører. Noen studier undersøker om et lite sett av genetiske markører er assosiert med sykdommen, mens i en genome-wide association study (GWA-studie) drar vi på fisketur blant millioner av genetiske markører.I GWA-studier innhenter vi informasjon om millioner av genetiske markører for tusener av friske og syke personer. For hver genetisk markør utfører vi en statistisk test for å undersøke om markøren kan ha en sammenheng med sykdom. Testen må ta hensyn til egenskaper ved hver person som kan påvirke hvordan personen kan utvikle sykdommen. Slike egenskaper kan være personens alder, kjønn, bosted, vaner (som røyking, mosjon eller kosthold), og generell helse. Resultatet fra testen kan presenteres som en p-verdi, der en lav p-verdi kan tolkes som indikasjon på en sammenheng mellom markøren og sykdommen. I GWA-studier vil vi ha millioner av p-verdier, og mange vil være lave ved rene tilfeldigheter, uten at det er noen reell sammenheng mellom markøren og sykdommen. Innen fagfeltet multippel testing ønsker vi å finne ut hvor lav p-verdien fra den statistiske testen bør være hvis man med stor trygghet skal si at man har et positivt funn. Family-wise error rate (FWER) er sannsynligheten for å få minst ett falskt positivt funn når vi utfører en statistisk test for hver genetisk markør i en GWA-studie. Målet med multippel testing er å velge en så høy terskelverdi som mulig for p-verdien – for jo høyere terskelverdien er, jo flere funn får vi – samtidig som FWER holdes fast, oftest på 5 %. Et av datasettene vi studerer i dette prosjektet er fra TOP-studien (http://www.med.uio.no/klinmed/forskning/sentre/kgj-psykoseforskning/), der personene i datasettet enten har bipolar lidelse, eller de ikke har en slik sykdom. I denne studien har vi data fra rundt 450 syke og 1100 friske personer, og vi har data fra over 700 000 genetiske markører for hver person. Ved å se på de innsamlede dataene er det mulig å si noe om avhengighetsstrukturen mellom de statistiske testene som utføres. Hvis det er slik at to genetiske markører ofte arves sammen, kan de begge gi en p-verdi som er veldig lav eller veldig høy. Dette kan vi utnytte i vår jakt på en så høy som mulig terskel for p-verdi. Det finnes generelle regler for hvor lav p-verdi-terskelen bør være når vi gjør et stort antall tester, hvis vi har som krav å ikke få høyere sannsynlighet enn 5 % for minst ett falskt positivt funn. Disse reglene tar gjerne ikke hensyn til hvordan avhengighetsstrukturen i de innsamlede dataene er, og en slik generell regel vil være veldig streng, det vil si at terskelen vil være veldig lav, fordi den også må kunne fungere når alle markørene arves uavhengig av hverandre og ikke har noen forbindelse med sykdommen. I GWA-studier kan gjerne en slik terskelverdi være så liten som 0.00000005. Det finnes andre metoder der man bruker simulering for å utnytte avhengighetsstrukturen i dataene til å finne en mindre streng terskel, men disse metodene krever store datamaskinressurser og er veldig tidkrevende. I dette prosjektet jobber vi med å finne effektive metoder for å finne en så høy som mulig terskel for p-verdi ved å regnet ut et effektivt antall tester, Meff. Metoden vi tar utgangspunkt i ble utviklet i 2008, og vi studerer hvordan vi optimalt kan finne Meff for GWA-studier der vi tar hensyn til egenskaper til hver person. Vår test er logistisk regresjon score test. Et sentralt tema i metoden er karakterisering av avhengighetsstrukturen mellom testene for de ulike genetiske markørene. I tillegg til å anvende metoden vår på datasettet fra TOP, vil vi også analysere data fra HUNT. Vi jobber nå med å skrive en statistisk publikasjon om Meff-metoden.

Vitenskapelige artikler

Halle Kari Krizak, Bakke Øyvind, Djurovic Srdjan, Bye Anja, Ryeng Einar, Wisløff Ulrik, Andreassen Ole Andreas, Langaas Mette

Efficient and powerful familywise error control in genome-wide association studies using generalized linear models

arXiv preprint arXiv:1603:05938

Halle Kari Krizak, Langaas Mette

Permutation in genetic association studies with covariates: controlling the familywise error rate with score tests in GLMs

arXiv preprint arXiv:1612:07010

Halle Kari Krizak, Djurovic Srdjan, Andreassen Ole Andreas, Langaas Mette

Is the familywise error rate in genomics controlled by methods based on the effective number of independent tests?

arXiv preprint arXiv:1612:04535

Deltagere

Anja Bye Forsker
Pål Sætrom Medveileder, biveileder
Øyvind Bakke Medveileder, biveileder
Mette Langaas Hovedveileder
Kari Krizak Halle Doktorgradsstipendiat

eRapport er utarbeidet av Sølvi Lerfald og Reidar Thorstensen, Regionalt kompetansesenter for klinisk forskning, Helse Vest RHF, og videreutvikles av de fire RHF-ene i fellesskap, med støtte fra Helse Vest IKT

Alle henvendelser rettes til Helse Midt-Norge RHF - Samarbeidsorganet og FFU

Personvern - Informasjonskapsler