Si discute da tempo sul contributo che l’intelligenza artificiale può dare alla medicina. In questo senso uno degli ambiti in cui tale contributo può arrivare più velocemente è l’analisi delle immagini diagnostiche: l’idea è che esaminando milioni di immagini gli algoritmi di deep e machine learning possano “imparare” a evidenziare patologie meglio di quanto possano fare i medici. All’inizio del 2017 è stato avviato un progetto che mira proprio a raggiungere questo obiettivo, nello specifico per la rilevazione del tumore al polmone.
Il progetto è stato in effetti un contest tra ricercatori per arrivare al migliore algoritmo di analisi delle immagini raccolte con la tomografia computerizzata a basso dosaggio di radiazioni, un sistema che si è dimostrato molto efficace nel rilevare lesioni di piccole dimensioni causate dal tumore al polmone e che ha l’importante vantaggio, come indica la sua denominazione, di prevedere un dosaggio molto basso di radiazioni. Inoltre è un esame veloce (una decina di secondi) e non richiede un mezzo di contrasto.
Il punto debole di questa tecnica è che presenta una quota di falsi positivi superiore alla media e che si vuole, ovviamente, ridurre. Diagnosticare un tumore al polmone che in realtà è una lesione benigna porta non solo stress al paziente ma anche a interventi chirurgici che sarebbe assai meglio evitare.
Così Booz Hallen Hamilton ha dedicato a questo problema l’edizione 2017 del suo Data Science Bowl, una competizione in cui ricercatori di tutto il mondo affrontano un problema legato alla salute, del pianeta o dei suoi abitanti.
Il lavoro dei ricercatori
Il National Cancer Institute (NCI) statunitense ha fornito ai partecipanti circa duemila immagini diagnostiche anonime ricavate con la TC a basso dosaggio. Circa 1.500 sono state usate come materiale per addestrare gli algoritmi di analisi delle immagini. Le altre 500 erano il “problema”: dopo l’addestramento degli algoritmi, questi le esaminavano e dovevano indicare se le lesioni presenti erano da attribuirsi a un tumore al polmone oppure no.
Gli algoritmi adottati per questo Data Science Bowl si sono tutti basati su reti neurali convoluzionali (CNN), che si ispirano al funzionamento della corteccia visiva e sono quindi particolarmente indicate per i problemi di riconoscimento visivo. Si tratta di reti neurali efficaci solo quando il campione di immagini per l’addestramento è molto corposo, il che ne ha limitato l’applicazione in campo medico.
Nonostante la diagnostica per immagini sia sempre più digitalizzata, infatti, è difficile per varie ragioni (tra cui la privacy) avere a disposizione migliaia di immagini da analizzare. Il Data Science Bowl è stato in questo senso una positiva eccezione.
Nel complesso sono stati prodotti circa 18 mila algoritmi di analisi per la diagnosi del tumore al polmone, che sono stati valutati in base alla percentuale di diagnosi corrette. I tre migliori sono stati prodotti nell’ordine da due ricercatori cinesi della Tsinghua University (Liao Fangzhou e Zhe Li), da una coppia di analisti americani ( Julian de Wit e Daniel Hammack) e da un team olandese (Team Aidence).
È stato comunque sottolineato che gli algoritmi hanno mostrato percentuali di efficacia molto simili, quindi quelli potenzialmente utilizzabili vanno anche oltre il podio.