Google Gemini ha solo 6 mesi di vita, ma ha già dimostrato capacità impressionanti in termini di sicurezza, codifica, debug e altre aree (naturalmente, ha anche mostrato seri limiti). Recentemente, il modello ha dimostrato capacità superiori agli esperti umani nel fornire consigli sul sonno e sul fitness.
PH-LLM: un modello ottimizzato per i dati sulla salute personale
I ricercatori di Google hanno presentato il Personal Health Large Language Model (PH-LLM), una versione di Gemini ottimizzata per comprendere e ragionare su serie temporali di dati sulla salute personale provenienti da dispositivi indossabili come smartwatch e cardiofrequenzimetri. Negli esperimenti condotti, il modello ha fornito risposte e previsioni significativamente migliori rispetto a esperti con anni di esperienza nel campo della salute e del fitness.
I dati acquisiti sul sonno, l’attività fisica, la salute cardiometabolica e lo stress tramite dispositivi indossabili sono raramente incorporati in contesti clinici a causa della mancanza di contesto e della difficoltà di memorizzazione, analisi e interpretazione. Inoltre, gli LLM spesso non sono in grado di ragionare e formulare raccomandazioni basate su questi dati.
PH-LLM supera gli esperti umani nei test sul sonno e sul fitness
I ricercatori di Google hanno addestrato il PH-LLM a formulare consigli, rispondere a domande di esami professionali e prevedere disturbi del sonno auto-riferiti e risultati di alterazione del sonno. Gemini ha ottenuto il 79% nell’esame del sonno e l’88% nell’esame di fitness, superando i punteggi medi ottenuti da un campione di esperti umani con diversi anni di esperienza nel settore.
Set di dati personalizzati per il sonno e il fitness
I ricercatori di Google hanno creato dei dataset di casi studio reali su sonno e fitness, in collaborazione con esperti del settore. Per il sonno hanno raccolto dati da dispositivi indossabili di 507 persone, come modelli di sonno, battito cardiaco ecc. Sulla base di questi dati gli esperti hanno fornito consigli personalizzati per migliorare la qualità del sonno.
Per il fitness hanno usato dati di allenamento, sonno, salute e feedback di 350 persone. Gli esperti hanno dato consigli sull’intensità dell’esercizio fisico ideale per ogni persona in una certa giornata. Su questi dataset Gemini di Google è stata addestrata e poi testata nel fornire consigli simili, superando le prestazioni degli esperti umani.
Gemini di Google dà consigli sulla salute ma deve ancora migliorare
I ricercatori di Google ammettono che il modello PH-LLM è ancora agli inizi e presenta alcuni limiti, come tutte le tecnologie emergenti. Ad esempio, le risposte e i consigli generati dall’AI non erano completamente coerenti tra loro quando applicati a casi di studio diversi. Inoltre, il modello tendeva ad essere troppo prudente e conservativo nelle previsioni e raccomandazioni fornite agli utenti. Mancava quindi di precisione e personalizzazione.
Ci sono quindi ancora margini di miglioramento nello sviluppo di assistenti AI per app di salute. I ricercatori dovranno lavorare per rendere il modello più solido, preciso e capace di fornire consigli coerenti e mirati alle reali esigenze dell’utente. Nonostante questi limiti attuali, lo studio dimostra il potenziale dei modelli conversazionali applicati al campo della salute e del benessere personale.