Anche il colosso newyorkese dei mass media ha il proprio modello linguistico (LLM, Large Language Model) e mira alla realizzazione di servizi IA basati su di esso: BloombergGPT. Come facilmente intuibile, l’approccio adottato è lo stesso che ha portato alla nascita di ChatGPT. In questo caso, però, la fase di istruzione è stata condotta partendo da un dataset composto perlopiù da dati inerenti al settore finanziario.
Un modello IA per la finanza: BloombergGPT
Al momento, non è ancora operativo. L’annuncio coincide con la pubblicazione di un documento a proposito del suo sviluppo. Più avanti tornerà utile agli addetti ai lavori di questo ambito per semplificare, velocizzare e automatizzare alcuni compiti come l’analisi del sentiment, la classificazione dei contenuti e la risposta a quesiti specifici.
Il progetto è stato curato dal team AI Engineering interno, impegnato anzitutto sulla costruzione e sul perfezionamento del dataset da dare in pasto agli algoritmi. Si è partiti da un enorme archivio di pubblicazioni proprie, appartenenti a quattro decenni, combinandolo poi con altre informazioni disponibili pubblicamente, arrivando così a superare i 700 miliardi di token. Infine, il modello è stato sottoposto a benchmark appositi per valutarne le potenzialità e l’efficacia.
Il modello BloombergGPT supera di gran lunga i modelli open esistenti di simili dimensioni nelle attività legate alla finanza, risultando inoltre alla pari o superiore nei benchmark generali.
Shawn Edwards, Chief Technology Officer del gruppo, afferma che un simile sistema potrà essere impiegato in un gran numero di nuove applicazioni. Al momento, però, sono stati rilasciati ulteriori dettagli in merito.
La migliore sintesi di ciò che questa intelligenza artificiale potrebbe rappresentare è forse quella fornita da NiemanLab. La redazione scrive: Pensate a un computer che mira a sapere tutto ciò che l’intera società conosce
.
Il vero punto di forza di BloombergGPT potrebbe essere proprio quello già citato: esser stato istruito non solo sulla base di dati ricavati dal Web, ma soprattutto proprietari (il 52% del totale), già verificati, dunque con provenienza nota e ritenuta affidabile. Questo potrebbe garantire al modello prestazioni migliori in termini di affidabilità e coerenza.
Maggiori informazioni a proposito dello sviluppo possono essere consultate in un documento dedicato.