Il machine learning può aiutare la formazione medica e un buon esempio viene dalle analisi laparoscopiche.
Le laparoscopie hanno una caratteristica che interessa magari poco i pazienti ma i medici sì: sono una fonte molto ricca di contenuti video.
È ovvio, se ci si pensa, perché in una laparoscopia il chirurgo viene guidato proprio dalle immagini che vengono trasmesse da una videocamera a fibre ottiche.
E dato che una operazione può durare anche diverse ore, c’è una grande quantità di “girato” che potrebbe essere usato nella formazione di altri medici e oggi anche – con la diffusione dell’intelligenza artificiale in medicina – per l’addestramento gli algoritmi di machine learning.
Il condizionale però è d’obbligo: i contenuti video potrebbero essere usati in tal modo ma è raro che succeda. Per il semplice motivo che gli spezzoni davvero utili delle riprese di una laparoscopia sono quasi sempre pochi e per selezionarli è necessario rivedere tutto il filmato, identificarli ed estrarli. Il più delle volte non ne vale la pena.
Certo le cose cambierebbero se ci fosse un sistema “intelligente” in grado di farlo automaticamente e alcuni ricercatori del MIT e del Massachusetts General Hospital hanno sviluppato proprio qualcosa del genere.
È un sistema, per ora ovviamente sperimentale, basato su machine learning che è stato preparato per identificare alcuni momenti chiave di una laparoscopia, come ad esempio l’esecuzione di una biopsia, la rimozione di tessuti o la pulizia delle ferite.
In teoria l’algoritmo di machine learning può comunque essere addestrato per rilevare qualsiasi “momento” e anche, facendo un deciso passo in più, per effettuare previsioni in base a riprese in tempo reale, identificando ad esempio una situazione che che richiede un particolare strumento chirurgico.
Sintetizzare i video
Il sistema sviluppato dal MIT si basa sul concetto di coreset, in estrema sintesi un sottoinsieme molto limitato di una struttura dati molto più ampia che però identifica le sue caratteristiche salienti.
Nel caso dei video, un coreset è un blocco di pochi fotogrammi che offre una approssimazione adeguata delle decine o centinaia che lo precedono e lo seguono.
Riducendo una ripresa di una laparoscopia ai suoi coreset, la quantità di immagini da analizzare si riduce a circa un decimo di quella iniziale.
Per addestrare l’algoritmo di machine learning, i ricercatori si sono concentrati su un tipo particolare di laparoscopia e ne hanno evidenziato le sette fasi più importanti. Hanno poi dato in pasto all’algoritmo le riprese di queste fasi per otto operazioni distinte.
In questo modo l’algoritmo ha imparato a riconoscere le varie fasi e la sua capacità di identificarle è stata poi testata sui coreset video di altre quattro operazioni.
L’algoritmo ha identificato le fasi chiave con una accuratezza del 93 percento, dimostrando di dare ottime prestazioni anche con una base di conoscenza di pochi video.
È un elemento importante perché non è detto che tutti gli ospedali abbiano a portata di mano molte riprese di una particolare procedura su cui vorrebbero fare formazione.