SUNDHEDSDATA

Vi skal se på sygdomsforløb, ikke bare sygdomme

På sjette sal i Panum-bygningen på Det Sundhedsvidenskabelige Fakultet, Københavns Universitet, residerer professor i systembiologi og bioinformatik Søren Brunak. Han er leder af forskningsgruppen Translational disease systems biology, der forsker i, hvordan forskellige sygdomme og deres behandling påvirker hinanden, og hvordan man kan bruge sundhedsdata som beslutningsstøtte i klinikken.

 

Til forskel fra de klassiske epidemiologer, som ser på én sygdom ad gangen, ser Søren Brunak på alle sygdomme på én gang i sin forskning.

- Vi har traditionelt haft fokus på én sygdom ad gangen. Men det samme gen kan spille en rolle i flere forskellige sygdomme, så sygdommene hænger sammen. Derfor er det interessant, også fra et behandlingsmæssigt synspunkt, at bruge sundhedsdata til at se på sygdomsforløb og ikke bare på den enkelte sygdom, forklarer Søren Brunak.

Han har sammen med forskerkollegaer kortlagt de mange forskellige sygdomme, der går forud for kræft. De har analyseret 20 års historiske sundhedsdata fra 6,9 millioner danske patienter fra Landspatientregisteret og linket dem til data fra 700.000 kræftpatienter fra Cancerregisteret.1 Derved fandt de frem til hele 648 sygdomme, som var direkte associeret med en eller flere af 17 kræftformer. Og for syv kræftformer kunne de kortlægge det præcise mønster for, hvilke sygdomme der optræder i årene op til kræftdiagnosen og i hvilken rækkefølge (sygdoms-trajektorier). (Se figur længere nede på siden).

Næste skridt er at få en bedre biologisk forståelse for, hvordan de forskellige sygdomme hænger sammen, så man kan identificere patienter i øget risiko for at udvikle kræft og tilbyde dem screening og evt. forebyggende indsatser. Studiets resultater er desuden offentligt tilgængelige i et interaktivt online værktøj, som skal generere hypoteser til brug i fremtidig kræftforskning.

Finder biologiske sammenhænge i store mængder data

- Jeg ser på store mængder sundhedsdata og fokuserer på de biologiske sammenhænge: Hvad er de molekylære forklaringer på sygdomme, hvordan overlapper forskellige sygdomme molekylært og mekanistisk, og hvordan indvirker de på hinanden, fortæller Søren Brunak og tilføjer:

- Du kan komme til en sygdom fra mange forskellige retninger. Og måske skal den samme sygdom behandles forskelligt, alt efter hvilken retning du kom fra, fordi det hænger sammen med, hvilken retning din sygdom vil udvikle sig i. Det er noget, jeg fokuserer på i min forskning, og her er danske sundhedsdata fantastiske.

Det er dog ikke kun risikofaktorerne for at udvikle sygdom, der er interessante, men også de beskyttende faktorer, understreger han:

- Hvilke varianter har du i dit genom, som beskytter dig mod forskellige sygdomme? Det er i virkeligheden det mest interessante, for det kunne inspirere nye behandlinger på mere interessante måder.

Brug patientens historiske data i behandlingen

Vi kan blive endnu bedre til at udnytte vores unikke danske sundhedsdata. Og vi bør i langt højere grad bruge patientens egne historiske sundhedsdata i behandlingen, lyder budskabet fra Søren Brunak. Et studie, Søren Brunak har publiceret sammen med bl.a. professor Anders Perner, Rigshospitalet, viste, at når en patient indlægges på en intensivafdeling, kan en algoritme, der analyserer patientens historiske sundhedsdata de seneste 23 år, forudsige patientens risiko for at dø indenfor de næste måneder ret præcist. Og algoritmens risikoberegning er faktisk mere præcis end den risikoberegning, man normalt laver på afdelingen baseret på prøver og målinger indenfor de første 24 timer.2

 

Figure 1:

A stacked density plot of precancer disease occurrences across 10 years. The density of noncancer diagnoses occurrences before the cancer types (with at least 20 significant directional diagnosis pairs); breast, prostate, ovary, lung, skin, stomach, diffuse NHL (diff. NHL), and other NHL (other NHL) are shown at the ICD-10 chapter level represented by the colors. The timeline spans 15 years before first cancer diagnosis, but we only detected diagnoses within 10 years. The time at each diagnosis is averaged across all patients with cancer with that specific disease pair. Only disease pairs with a significant directionality are included.

Kilde: Baseret på Jessica X. Hu, Marie Helleberg, Anders B. Jensen, Søren Brunak and Jens Lundgren: A Large-Cohort, Longitudinal Study Determines Precancer Disease Routes across Different Cancer Types; Cancer Research; 79 (4) February, 2019.

Måske skal den samme sygdom behandles forskelligt,alt efter hvilken retning patienten kom fra.

- Når man lægger de to datatyper sammen – de aktuelle data fra prøver og målinger samt de historiske data på patienten – kan man forudsige dødeligheden endnu mere præcist. Og det er netop det princip, vi skal gøre brug af: Vi skal blive bedre til at bruge de patientforløbsdata, som er så unikke for Danmark, til at finde ud af, hvordan den enkelte patient behandles bedst, understreger han.

- Jeg fremhæver derfor ofte over for politikerne, at vi har alle de her fine registre og dataressourcer. Men vi bruger ikke patientens egne historiske data, når vi skal stille en diagnose og vælge behandling, siger han og tilføjer, at befolkningen måske også vil se mere positivt på forskernes brug af deres sundhedsdata, hvis de kan se, at de selv som enkeltindivider kan få gavn af det.

Kunstig intelligens og supercomputer

Søren Brunak ser på data på en holistisk måde for at finde mønstre, der kan gøre os klogere. Men for at integrere store mængder af forskellige datatyper på den måde, er der brug for machine learning og kunstig intelligens. Det har længe været et interesseområde for Søren Brunak, der både var medforfatter til den første lærebog om bioinformatik og machine learning med titlen Bioinformatics – The Machine Learning Approach (1998) og til bogen Neurale netværk: Computere med intuition (1988).

Siden da har Søren Brunak været med til at videreudvikle metoden i sin forskning. Seneste skud på stammen er anvendelse af text mining, hvor han benytter en supercomputer til at gennemgå og analysere patienternes digitale journaler.

- Hvis du for eksempel vil vide, hvilke bivirkninger forskellige lægemiddelkombinationer giver, kan du ikke bare slå det op i et register. For de middelsvære bivirkninger og de ikke så alvorlige bivirkninger bliver ofte ikke indrapporteret. De er gemt i patientjournalerne, hvor sygeplejersken for eksempel kan have skrevet, at en patient fik migræne, da disse fire lægemidler blev givet samtidig, mens en anden patient fik fem andre lægemidler samtidig og ikke fik migræne, forklarer han.

- Fordi vi har adgang til millioner af journaler, kan vi se på data på tværs af laboratoriesvar, tekst i journalen og diagnosekoderne, fortæller Søren Brunak og understreger, at det fantastiske ved danske data netop er, at de kan linkes.

- I Holland har de personnumre, men de har en lovgivning, der forbyder, at man linker datatyper. Og det er altså ikke nogen god ide, hvis man gerne vil forstå en sygdom eller vil underopdele en patientgruppe i nogle mindre grupper, der skal have en forskellig behandling.

Data kan forudsige optimal behandlingsrækkefølge

Ved at se på store mængder historiske sundhedsdata kan man også forudsige den optimale behandlingsrækkefølge, fastslår Søren Brunak. Han har analyseret 24 års data fra det danske Lægemiddelstatistikregister – et af de største og ældste receptregistre i verden. Mere end 1,1 milliarder recepter fra 7,2 mio. danskere. Han brugte det store datasæt til at kortlægge de mest almindelige mønstre for, hvilke typer medicin der er givet og i hvilken rækkefølge (recept-trajektorier). Patienterne blev stratificeret på baggrund af

recept-trajektorierne, og hazard ratio for overlevelse mellem de stratificerede grupper blev beregnet. Hypertension blev brugt som case, og det viste sig, at recept-trajektorierne kunne bruges til at finde frem til de patienter, der ville have gavn af at få en anden behandling end førstelinjebehandlingen.3

- Da jeg skrev om vores studie på recept-trajektorierne på LinkedIn, fik det meget hurtigt 60.000 views, ler Søren Brunak. Hans forskning vækker generelt stor interesse både herhjemme og i udlandet, hvor man skeler misundeligt til de store mængder sundhedsdata fra hele befolkningen, som Søren Brunak kan kæde sammen på tværs ved hjælp af vores CPR-nummer.

- Vi er jo ikke de første, der har kigget på patientforløb og trajektorier. Men så har det for eksempel været 1200 patienter med en specifik sygdom. Det nye er, at vi her har set på millioner af mennesker, og vi har fundet en supercomputer- vinkel på det, hvor vi har fået tilladelse til at flytte data fra de 1,1 milliarder recepter til et sikkert sted og lave beregninger der, forklarer Søren Brunak.

Ikke kun traditionelle sundhedsdata

Søren Brunak ser også interessante perspektiver i at analysere data, som ikke er traditionelle sundhedsdata, men som kan sige noget om vores sundhed. Det kan være PRO-data (Patient-Reported Outcome), data på vores indkøb samt data på søvn, motion osv. indsamlet via smartwatches og andre wearables eller via elmålere.

- Jeg er stor tilhænger af at afprøve, hvilken prædiktiv værdi de data har i forhold til at subgruppere patienter og i forhold til at vælge behandling til den enkelte patient. Sammen med Danmarks Statistik ser vi for eksempel på Smartmeter-data, som er monitorering af el- og vandforbrug, siger han.

Alle husstande har en el-måler, og vores måde at bruge vand og strøm på siger noget om, hvornår vi står op om morgenen, om vi er oppe i løbet af natten osv. Disse data kan Søren Brunak koble med store mængder traditionelle sundhedsdata. Formålet er at se mønstre og undersøge, om der er noget, der korrelerer.

- Det kan jo for eksempel være, at A-mennesker har bedst outcome, hvis de bliver opereret om eftermiddagen, og B-mennesker om morgenen, eller omvendt. I nogle tilfælde vil der være kausalitet, og i andre tilfælde er der ikke noget i det.

Der er nogle, der mener, at alle data i princippet er sundhedsdata, og det er Søren Brunak enig i:

- Alle data er interessante i forhold til at finde ud af, om de kan bruges til at sige noget om sundhed. På den måde er jeg lidt altædende, når det kommer til data. I hvert fald i forhold til at teste dem af og konservativt prøve at validere dem, slutter han.

 

1. Hu JX, Helleberg M, Jensen AB, Brunak S, Lundgren J. A Large-Cohort, Longitudinal Study Determines Precancer Disease Routes across Different Cancer Types. Cancer Res. 2019 Feb 15;79(4):864-872.

2. Nielsen AB, Thorsen-Meyer HC, Belling K, Nielsen AP, Thomas CE, Chmura PJ, Lademann M, Moseley PL, Heimann M, Dybdahl L, Spangsege L, Hulsen P, Perner A, Brunak S. Survival prediction in intensive-care units based on aggregation of long-term disease history and acute physiology: a retrospective study of the Danish National Patient Registry and electronic patient records. Lancet Digit Health. 2019 Jun;1(2):e78-e89.

3. Aguayo-Orozco A, Haue AD, Jørgensen IF, Westergaard D, Moseley PL, Mortensen LH, Brunak S. Optimizing drug selection from a prescription trajectory of one patient. NPJ Digit Med. 2021 Oct 20;4(1):150.