Google ha presentato AMIE, il suo sistema di intelligenza artificiale che sa condurre colloqui medici come un vero dottore. AMIE ha dimostrato di essere più bravo dei medici umani nel parlare con pazienti e nel fare diagnosi basate sulla loro storia clinica.
AMIE si basa su un modello linguistico di grandi dimensioni (LLM) creato da Google, ottimizzato per il dialogo diagnostico e l’anamnesi”, dice Alan Karthikesalingam, ricercatore clinico di Google Health a Londra e coautore dello studio, pubblicato l’11 gennaio sul sito arXiv preprint. Lo studio non è ancora stato revisionato da altri esperti.
AMIE: un esperimento da interpretare con cautela
AMIE è ancora un esperimento e non è pronto per essere usato nella pratica clinica. Non è stato testato su persone reali con problemi di salute, ma solo su attori che simulavano di avere delle malattie. “I risultati vanno interpretati con cautela e umiltà”, dice Karthikesalingam.
Gli autori dello studio pensano che l’AI potrebbe avere un ruolo nella democratizzazione dell’assistenza sanitaria, rendendo la diagnosi medica più accessibile. Tuttavia, non vogliono sostituire i medici con il chatbot, ma solo integrarli. “La medicina non è solo raccogliere informazioni, ma anche creare relazioni umane”, dice Adam Rodman, medico di medicina interna alla Harvard Medical School di Boston, Massachusetts.
Come AMIE ha imparato a fare il dottore
Finora pochi progetti hanno esplorato la capacità dei sistemi di intelligenza artificiale di emulare il processo diagnostico dei medici a partire dalla storia clinica del paziente. Come spiega Rodman, gli studenti di medicina dedicano molto tempo ad allenare questa competenza fondamentale: “Fare l’anamnesi dei paziente e utilizzarla per formulare una diagnosi è una delle abilità più importanti e difficili da insegnare ai futuri medici“. AMIE rappresenta uno dei primi sistemi AI in grado di avvicinarsi alle performance di un medico in questo aspetto cruciale della pratica clinica.
La sfida per gli sviluppatori è stata trovare delle conversazioni mediche reali da usare come dati di addestramento, dice Vivek Natarajan, ricercatore di AI di Google Health a Mountain View, in California, e coautore dello studio. Per risolvere questo problema, i ricercatori hanno fatto in modo che il chatbot si addestrasse con le sue “conversazioni”.
I ricercatori hanno prima adattato l’LLM di base con dei dati reali esistenti, come le cartelle cliniche elettroniche e le conversazioni mediche trascritte. Poi hanno fatto in modo che il modello interpretasse due ruoli: quello di una persona con una malattia specifica e quello di un medico empatico che cerca di capire la sua storia e di fare delle diagnosi.
I ricercatori hanno anche fatto interpretare all’LLM un altro ruolo: quello di un critico che valuta la conversazione tra il medico e il paziente e dà dei suggerimenti per migliorarla. Lo studio ha confrontato le prestazioni di AMIE con quelle di 20 medici certificati, usando 20 attori che si fingevano pazienti. I risultati sono sorprendenti: il chatbot ha dimostrato una precisione diagnostica pari o superiore a quella dei medici umani.
Come funziona AMIE
AMIE è un acronimo di Automated Medical Information Extraction, ed è basato su modelli di linguaggio avanzati che analizzano le domande e le risposte dei pazienti. Il sistema è in grado di riconoscere i sintomi, le condizioni e i trattamenti possibili, e di fornire una diagnosi basata sull’evidenza scientifica. AMIE può anche interagire con i pazienti in modo cortese, chiaro e professionale, esprimendo attenzione e impegno.
Per testare il sistema, i ricercatori hanno creato 149 scenari clinici, basati su sei specialità mediche: cardiologia, dermatologia, endocrinologia, gastroenterologia, neurologia e reumatologia. Hanno poi chiesto agli attori di simulare i pazienti e di avere delle consultazioni online con AMIE o con i medici, senza sapere chi fosse il loro interlocutore. Al termine delle consultazioni, gli attori e un gruppo di specialisti hanno valutato l’esperienza e le prestazioni di AMIE e dei medici.
I vantaggi e i limiti di AMIE
Lo studio ha mostrato che AMIE ha eguagliato o superato i medici in tutte le specialità mediche considerate, sia in termini di accuratezza diagnostica che di qualità della conversazione. Il chatbot ha ottenuto punteggi migliori dei medici in 24 dei 26 criteri valutati dai pazienti e in 28 dei 32 criteri valutati dagli specialisti.
Tuttavia, questo non significa che AMIE sia migliore dei medici nella raccolta della storia clinica, precisa Alan Karthikesalingam, uno dei ricercatori di Google. Karthikesalingam spiega che i medici dello studio potrebbero non essere stati abituati a comunicare con i pazienti tramite una chat testuale, e che questo potrebbe aver influito sulle loro prestazioni. Inoltre, AMIE ha il vantaggio di poter scrivere rapidamente risposte lunghe e ben strutturate, senza stancarsi o distrarsi.
Le sfide future per AMIE
Il sistema di Google è ancora in fase sperimentale e richiede ulteriori studi per valutare i potenziali pregiudizi e garantire che sia equo tra le diverse popolazioni. Il team di Google sta anche iniziando a esaminare i requisiti etici per testare il sistema con esseri umani che hanno problemi medici reali.
Daniel Ting, scienziato clinico di IA presso la Duke-NUS Medical School di Singapore, concorda sul fatto che sondare il sistema per individuare eventuali pregiudizi sia essenziale per assicurarsi che l’algoritmo non penalizzi i gruppi razziali che non sono ben rappresentati nei set di dati di addestramento.
Anche la privacy degli utenti dei chatbot è un aspetto importante da considerare, dice Ting. “Per molte di queste piattaforme commerciali di modelli linguistici di grandi dimensioni, non sappiamo ancora dove vengono archiviati i dati e come vengono analizzati”, afferma Ting.