Tekoäly tekee yhtä luotettavia diagnooseja kuvista kuin ihmislääkäri, uusi tieteellinen katsaus kertoo. Asiantuntijat ovat kuitenkin varoittaneet, että tulokset pohjautuvat pieneen määrään tutkimuksia, sillä alalla julkaistaan paljon heikkolaatuista tutkimusta. Aiheesta kirjoittaa The Guardian.

Yksi nopeasti kehittyvä osa-alue on lääketieteellisten kuvien tulkinta, joka perustuu syväoppimiseen eli koneoppimisen hienostuneeseen muotoon. Siinä sarja nimettyjä kuvia syötetään algoritmille, joka valitsee kuvista ominaisuuksia ja opettelee luokittelemaan samankaltaisia kuvia.

Tätä lähestymistapaa on pidetty lupaavana erilaisten sairauksien diagnosoinnissa aina syövästä silmäsairauksiin.

Epävarmaa on ollut, kuinka tällainen syväoppimiseen perustuva järjestelmä vertautuu ihmisen taitoihin. Nyt tutkijat sanovat tehneensä ensimmäisen kattavan katsauksen aihetta käsittelevistä tutkimuksesta.

Tuloksena on, että ihminen ja kone pärjäävät yhtä hyvin.

Yksi tutkimuksen kirjoittajista, professori Alastair Denniston sanoo, että tulokset ovat rohkaisevia, mutta katsaus palautti realismia tekoälyyn liittyvään hypeen.

– Paljon näkee otsikoita siitä, kuinka tekoäly suoriutuu ihmistä paremmin, mutta viestimme on, että se voi parhaimmillaankin olla vain yhtä hyvä, sanoo katsauksen pääkirjoittaja Xiaoxuan Liu.

Tutkijat keskittyivät vuonna 2012 ja myöhemmin julkaistuihin tutkimukseen. Tuo oli käänteentekevä vuosi syväoppimiselle. Alkuperäisessä haussa löytyi yli 20 000 aihetta käsittelevää tutkimusta, mutta niistä vain 14 oli käyttänyt laadukasta dataa, testannut syväoppimista eri datalla kuin millä algoritmiä oli opetettu, ja näyttänyt saman kuvat myös ihmisasiantuntijoille.

Katsauksen koonnut tutkimusryhmä keräsi kaikkein lupaavimmat tulokset jokaisesta 14 tutkimuksesta. Paljastui, että syväoppiminen tunnisti sairauden 87 prosentissa tapauksesta – ihmisillä luku oli 86 prosenttia. Syväoppiminen totesi potilaan terveeksi oikein 93 prosentissa tapauksista – ihminen taas 91 prosentissa.

Tutkimuksissa lääketieteen ammattilaisilla ei ollut käytössään potilasta koskevia, diagnoosia ohjaavia lisätietoja, joita heillä olisi oikeassa tilanteessa ollut.

Professori David Spiegelhalter Cambridgen yliopistosta sanoo, että ala on täynnä huonoja tutkimuksia.

– Tämä erinomainen katsaus osoittaa, kuinka tekoälyn massiivinen hypetys hämärtää lähes kaikkien arviointitutkimusten murheellisen huonoa laatua. Syväoppiminen voi olla merkittävä tekniikka, mutta kliinikoiden ja tilaajien pitäisi kysyä olennainen kysymys: mitä se oikeasti tuo lisää kliiniseen työhön?

Denniston suhtautuu yhä optimistisesti tekoälyn mahdollisuuksiin terveydenhuollossa. Hänen mukaansa syväoppivat järjestelmät voisivat toimia työkaluina diagnostiikassa ja auttaa purkamaan ruuhkaa kuvauksissa.

Lisäksi Liun mukaan ne voisivat olla käyttökelpoisia siellä, missä ei ole tarpeeksi asiantuntijoita tulkitsemaan kuvia. Olisi tärkeää käyttää syväoppivia järjestelmiä arvioimaan, paranisiko potilaiden tilanne verrattuna nykyisiin käytäntöihin, hän sanoo.

Syöpätautien erikoislääkäri Raj Jena Addenbrooken sairaalasta Cambridgesta sanoi, että syväoppiva järjestelmät voivat olla tulevaisuudessa tärkeitä. Jena, joka ei ollut mukana tutkimuksessa, korostaa vaativien testein tarvetta todellisessa ympäristössä.

Hänen mukaansa on myös tärkeää ymmärtää, miksi järjestelmät tekevät virheitä. Virheet kun ovat usein arvaamattomia ja varsin merkittäviä.

Tutkimus julkaistiin The Lancet Digital Health -tiedelehdessä.