Mens USA og Kina buldrer afsted med avancerede sprogmodeller, ser EU ud til at være fanget i slowmotion. Men kapløbet er slet ikke slut, skriver Tove Holm-Larsen.Foto: Privat

Har EU tabt AI-kapløbet indenfor medicin? Mens USA og Kina bygger højhastighedstog, kan Europa skabe et GPS-system, der sikrer, at vi når frem på den gode måde. AI inden for medicin er ikke kun et kapløb, hvor det handler om at komme først – men måske allermest et spørgsmål om at komme frem i live og uden for mange bivirkninger, skriver sundhedsøkonom Tove Holm-Larsen.

USA og Kina buldrer derudad med avancerede sprogmodeller, mens EU ser ud til at være fanget i slowmotion. Men kapløbet er langt fra slut.

De store sprogmodeller fungerer som en motorvej – hurtige, effektive, men ikke altid den bedste rute. Især inden for medicin, hvor præcision og gennemsigtighed er afgørende. Her kan black-box modeller, der leverer gennemsnitlige svar, være en risikabel strategi, for her handler det ikke kun om hastighed, men især om at forstå vejen til ny viden.

EU har muligheden for at tage en anden vej: At investere i AI-løsninger, der er skræddersyet til videnskabens strenge krav. Mens USA og Kina bygger højhastighedstog, kan Europa skabe et GPS-system, der sikrer, at vi når frem på den gode måde. AI indenfor medicin er ikke kun et kapløb, hvor det handler om at komme først – men måske allermest et spørgsmål om at komme frem i live og uden for mange bivirkninger.

Er ChatGPT ikke allerede super god til at diagnosticere?

Men hvorfor diskutere en ny AI-vej til medicinsk viden, hvis de nuværende sprogmodeller allerede virker?

I en undersøgelse fra 2023 publiceret i New England Journal of Medicine’s nye AI-tidsskrift blev chatGPT’s evne til at stille sjældne og komplekse diagnoser sammenlignet med en kontrolgruppe af læger. Her var chatGPT lige så god og nogle gange endda bedre end lægerne. Og i maj 2024 introducerede Google chatbotten ’Med-Gemini’, som har imponerende 90 pct. nøjagtighed i diagnosticering.

Det er opsigtsvækkende gode resultater og skubber naturligvis bag på en interesse for at inddrage chatbotter til beslutningsstøtte i den kliniske hverdag, men det er altafgørende, at vi holder fast ved, hvad god evidensdrevet medicin er.

God medicinsk videnskab bygger på transparens og reproducerbarhed. En black box-algoritme, der giver et korrekt svar uden forklaring, kan være lige så farlig som en forkert diagnose.

I medicin er djævlen i detaljen 

Inden for medicin er djævlen i detaljen. Historien er fyldt af eksempler, hvor vi er gået forkert, fordi vi har troet på et hurtigt håb/ikke fik efterprøvet en antagelse ordentligt.

I 2006 publicerede Sylvain Lesné en artikel, hvor han viste, at hvis man sprøjtede beta-amyloid ind i hjernen på rotter, så udviklede de hurtigt demenssymptomer. Studiet bakkede op om en eksisterende teori om, at beta-amyloid spiller en væsentlig rolle i udviklingen af Alzheimers sygdom, og fik så meget omtale, at det reelt drejede forskning i alzheimers i 20 år.

Det eneste problem med studiet var, at dataene var blevet ændret, så resultaterne så bedre ud, end de var. Konsekvensen blev fatal: 20 års forskning i en udbredt og rædselsfuld sygdom uden noget gennembrud.

Men hvad har det med chatbotter og black-box algoritmer at gøre? Chatbotter er kendt for at hallucinere og opfinde nye resultater. I en opdateret gennemgang af chatbotters hallucinationsgrad fra februar 2025 er Gemini-2.0 helt nede på 0,7 pct. hallucinationer, men 0,7 pct. er stadig for meget. Især når det er koblet med en black-box algoritme, hvor vi ikke kan følge vejen hen til resultatet.

For det fjerner muligheden for en anden essentiel videnskabelig dyd: Muligheden for at reproducere et resultat. Når det blev afsløret, at Lesné og kollegaer havde ændret på dataene, så skyldes det netop, at data var lagt frem, og andre videnskabsfolk kunne teste, om det var muligt at reproducere forsøget skridt for skridt.

Nye ideer opstår ikke via et gennemsnit

Reproducerbarhed og fuld transparens af data er altså essentielt, når det kommer til dokumentation af medicinsk effekt og sammenhæng, men er det lige så vigtigt, når det kommer til ny innovation? Kan de lynhurtige sprogmodeller ikke hjælpe os her?

Medicinske gennembrud starter således ofte med nysgerrighed og tilfældigheder. Problemet med de nuværende sprogmodeller er, at de er baseret på statistik og forstørrer fokus på gennemsnittet snarere end de overraskende tilfældigheder

Den medicinske historie er fyldt med gode eksempler på kvantespring, hvor vi pludselig har fået en helt ny indsigt – tænk f.eks. på Alexander Fleming og hans tilfældige opfindelse af penicillin. En opfindelse der har haft umådelig indflydelse på moderne lægevidenskab.

Et andet godt eksempel på vigtigheden af tilfældigheder er fra Viagras fødsel, hvor det kliniske studie ikke gav den effekt på blodtrykket, som man håbede på, men bivirkningsbeskrivelserne og det faktum, at forsøgspersonerne ikke ville af med medicinen, da forsøget sluttede, gav en indikation om en helt anden effekt.

Medicinske gennembrud starter således ofte med nysgerrighed og tilfældigheder. Problemet med de nuværende sprogmodeller er, at de er baseret på statistik og forstørrer fokus på gennemsnittet snarere end de overraskende tilfældigheder. Modellerne er således bygget til at nedtone det overraskende, besynderlige resultat og forstørre det gennemsnitlige.

Der er plads til EU’s vej, men vi skal i gang nu

AI-kapløbet indenfor medicin og videnskab er altså langt fra slut. USA og Kina har anlagt nogle store motorveje, men de er bygget op omkring black-box algoritmer og gennemsnit og ikke omkring transparens og reproducerbarhed. Europa har således stadig en vigtig mulighed for en førertrøje i AI – men det kræver, at vi investerer massivt og tænker klogt.

Det handler ikke kun om at bygge større modeller, men om at bygge dem rigtigt. Medicin og videnskab kræver AI, der er gennemsigtig, pålidelig og tilpasset videnskabelige dyder, såvel som vores fælles værdier.

Er der nogen, der kan bygge sådanne sprogmodeller, så er det EU. Så lad os få skub i EU’s seneste AI-investeringsinitiativ og insistere på, at det IKKE er teknikken, som bestemmer målet, men at målet er evidensbaseret videnskab, som teknikken skal bakke op om.

Skriv kommentar