Hugging Face ha svelato SmolLM, una nuova famiglia di modelli linguistici compatti che superano in prestazioni le offerte simili di colossi del settore come Microsoft, Meta e Alibaba. Questi modelli portano capacità avanzate di intelligenza artificiale sui dispositivi personali senza compromettere le prestazioni o la privacy degli utenti.
La famiglia SmolLM offre tre dimensioni – 135 milioni, 360 milioni e 1,7 miliardi di parametri – pensate per adattarsi a diverse risorse computazionali. Nonostante le dimensioni ridotte, questi modelli hanno dimostrato risultati superiori nei benchmark che testano il ragionamento di senso comune e la conoscenza del mondo.
Hugging Face sfida i giganti dell’AI con modelli mirati e compatti
Come ha spiegato Loubna Ben Allal, lead ML engineer di SmolLM presso Hugging Face: “Non abbiamo bisogno di grandi modelli fondamentali per ogni attività, proprio come non abbiamo bisogno di una palla da demolizione per fare un buco in un muro. Piccoli modelli progettati per compiti specifici possono fare molto“.
A differenza di altre aziende, Hugging Face ha reso completamente open source l’intero processo di sviluppo dei suoi modelli linguistici SmolLM, dalla raccolta dei dati fino all’addestramento vero e proprio. Questa scelta riflette l’impegno dell’azienda verso i principi dell’open source e della ricerca riproducibile, consentendo una totale trasparenza.
Le ottime prestazioni di SmolLM sono il risultato dell’accurata selezione dei dati di addestramento. In particolare, i modelli si basano sul Cosmo-Corpus, che comprende Cosmopedia v2, una raccolta di libri di testo e storie sintetiche, Python-Edu, ovvero esempi di codice Python e FineWeb-Edu, contenuti web selezionati appositamente per l’apprendimento dell’intelligenza artificiale.
SmolLM porta l’intelligenza artificiale sui dispositivi personali
Il rilascio di SmolLM potrebbe avere un impatto significativo sull’accessibilità e sulla privacy dell’AI. Questi modelli possono essere eseguiti su dispositivi personali come telefoni e laptop, eliminando la necessità di cloud computing e riducendo i costi e i problemi di privacy.
Ben Allal ha sottolineato l’aspetto dell’accessibilità: “La possibilità di eseguire modelli piccoli e performanti su telefoni e PC rende l’AI accessibile a tutti. Questi modelli aprono nuove possibilità a costo zero, con una privacy totale e una minore impronta ambientale“.
Si tratta di un traguardo importante, se consideriamo che le principali big tech, come Microsoft e Google hanno registrato un aumento delle emissioni di gas serra a causa dello sviluppo dell’AI.
Un Passo Avanti per l’AI accessibile, rispettosa della privacy e sostenibile
Lo sviluppo di modelli potenti ed efficienti su piccola scala come SmolLM rappresenta un cambiamento significativo nel campo dell’AI. Rendendo le capacità avanzate di AI più accessibili e rispettose della privacy, Hugging Face risponde alle crescenti preoccupazioni sull’impatto ambientale dell’AI e sui dati personali.