Sul mercato internazionale stanno arrivando sempre più soluzioni alternative a ChatGPT: ad esempio, recentemente Alibaba ha svelato la sua IA rivale, Tongyi Qianwen, che tuttavia resterà limitata entro i confini del Dragone. In Occidente, invece, è la società americana Databricks a rilasciare il primo modello di linguaggio di grandi dimensioni (LLM) open source messo a punto su dati umani: si chiama Dolly 2.0 e potrebbe fungere da nuova base per i servizi concorrenti di ChatGPT.
Arriva Dolly 2.0, il rivale open source di ChatGPT
Con i suoi 12 miliardi di parametri usati per l’addestramento, Dolly 2.0 si propone come modello di linguaggio completamente gratuito e open source utilizzabile “senza pagare per l’accesso API o condividere dati con terze parti”. Si tratta di un salto importante rispetto alla prima iterazione Dolly 1.0, rilasciata lo scorso marzo e limitata commercialmente in quanto utilizzava dati di addestramento provenienti da ChatGPT, ergo soggetti ai termini di servizio di OpenAI.
Il nuovo set di dati creato tra inizio marzo e queste prime settimane di aprile tramite crowdsourcing, al contrario, è soggetto alla licenza Creative Commons e, pertanto, può essere utilizzato, modificato ed esteso per qualsiasi scopo, incluse le applicazioni commerciali.
Scendendo nel dettaglio, il modello databricks-dolly-15k su cui Dolly 2.0 si basa è stato generato con informazioni di alta qualità, può offrire risposte lunghe alla maggior parte delle richieste e gode del supporto di molteplici professionisti da più settori.
Queste le parole conclusive di Databricks:
“Abbiamo sentito ripetutamente dai nostri clienti che sarebbero serviti meglio se possedessero i loro modelli, consentendo loro di creare soluzioni di qualità superiore per le loro applicazioni specifiche senza consegnare i loro dati sensibili a terzi. Riteniamo inoltre che le questioni importanti di parzialità, responsabilità e sicurezza dell’IA dovrebbero essere affrontate da un’ampia comunità di diverse parti interessate piuttosto che solo da poche grandi aziende. I set di dati e i modelli dall’origine aperta incoraggiano commenti, ricerca e innovazione che contribuiranno a garantire che tutti traggano vantaggio dai progressi della tecnologia dell’intelligenza artificiale.”