Claude riflette durante la conversazione grazie al tool Think

Anthropic ha trovato un modo semplice ma efficace per migliorare le capacità di Claude: fargli prendere appunti mentre lavora. Questo “blocco note” digitale, insieme ad alcuni prompt di esempio, migliora notevolmente le abilità di problem-solving del suo assistente AI.

Lo strumento “think” di Anthropic permette a Claude di ragionare durante la conversazione

Il cuore di questa innovazione è il comando “think”, che permette a Claude di registrare il proprio ragionamento prima di rispondere o prendere una decisione. Questo spazio di lavoro interno non è altro che un semplice JSON, che tiene traccia di questi pensieri:

{
“name”: “think”,
“description”: “Use the tool to think about something. It will not obtain new information or change the database, but just append the thought to the log. Use it when complex reasoning or some cache memory is needed.”,
“input_schema”: {
“type”: “object”,
“properties”: {
“thought”: {
“type”: “string”,
“description”: “A thought to think about.”
}
},
“required”: [“thought”]
}
}

Il nuovo tool “think” si distingue dalla recente funzione “Extended Thinking”. Mentre quest’ultima aiuta Claude a ragionare prima di generare una risposta, “think” entra in gioco durante il processo stesso di risposta, specialmente quando Claude deve elaborare nuove informazioni da altri strumenti.

Assistenti AI più efficienti nel supporto clienti

Anthropic ha testato il nuovo sistema di Claude su scenari di customer service per le compagnie aeree utilizzando il framework Tau Bench, un ambiente di valutazione progettato per misurare le prestazioni dell’AI in compiti pratici e complessi.

I risultati sono stati sorprendenti: grazie a un prompt ottimizzato, Claude ha superato la baseline di ben il 54%. Se applicata su larga scala quindi, questa innovazione potrebbe rendere gli assistenti AI molto più efficaci in ambiti critici, come il supporto clienti, l‘automazione dei processi aziendali e le interazioni complesse che richiedono uno ragionamento step by step.

Anche se nei test SWE-Bench, un benchmark che valuta le capacità dell’AI nel risolvere problemi di programmazione e debugging, Claude i miglioramenti ottenuti grazie al nuovo approccio di Claude sono stati più modesti (con un incremento dell’1,6% nei punteggi). Cosa vuol dire quindi? Che nel contesto della programmazione, l’uso del comando “think” da solo non basta a ottenere risultati eccezionali. In altre parole, l’AI ha bisogno di linee guida e prompt specifici per sfruttare al massimo questo strumento.

Quando usare il tool “think”

Secondo Anthropic, il comando “think” è utilissimo per analizzare l’output di altri strumenti, seguire regole complesse e prendere decisioni passo-passo dove gli errori potrebbero essere costosi. Il tool si integra facilmente nei sistemi Claude esistenti e incide sulle prestazioni del modello solo quando viene effettivamente usato. Nella maggior parte dei test è stato utilizzato Claude 3.7 Sonnet, ma dovrebbe funzionare altrettanto bene con Claude 3.5 Sonnet.

Annulla

Stai citando questo messaggio:

NaN undefined

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech