Anthropic ha annunciato una versione aggiornata del modello Claude 3.5 Sonnet che può essere utilizzato per controllare il computer. Attraverso le nuove API “Computer Use” è possibile simulare le azioni eseguite da una persona davanti allo schermo, tra cui lo spostamento del mouse. La startup californiana ha inoltre svelato il nuovo modello Claude 3.5 Haiku.
Claude sposta il mouse, clicca e scrive
Gli sviluppatori possono utilizzare le API (beta) per far eseguire a Claude 3.5 Sonnet alcuni azioni umane. Il modello può comprendere e interagire con qualsiasi app desktop (nel video dimostrativo si vede Google Fogli in Chrome). Può guardare lo schermo, spostare il mouse, cliccare i pulsanti e scrivere testo.
Le API consentono di tradurre istruzioni/input (ad esempio “usa dati dal mio computer e compila un form online“) in comandi per computer, come quelli necessari per leggere il contenuto di un foglio di lavoro, spostare il puntatore del mouse per aprire un browser, cercare una pagina, prelevare i dati dalla pagina e compilare il form. L’accesso ai dati viene effettuato con il consenso dell’utente.
Oltre che tramite le API di Anthropic, la funzionalità di Claude 3.5 Sonnet è accessibile con Amazon Bedrock e Vertex AI di Google Cloud. In generale, le prestazioni del nuovo modello sono notevolmente migliorate e sono superiori a quelle di OpenAI GPT-4o e Google Gemini 1.5 Pro in quasi tutti i benchmark.
Claude 3.5 Haiku è invece la nuova versione del modello più efficiente ed economico. Le prestazioni sono superiori a quelle di Claude 3 Opus in molte operazioni. Sarà disponibile entro fine mese (solo input testuale).