L’impatto di ChatGPT nel settore tech è evidente, non solo per il numero di utenti che accede quotidianamente al chatbot di OpenAI, ma anche in virtù della nascita di numerose alternative come Bing Chat, Google Bard, o servizi meno noti come HuggingChat che puntano su altre caratteristiche, tra cui la natura open-source. Siamo effettivamente all’inizio dell’effetto valanga dei modelli di linguaggio, eppure il numero di soluzioni alternative al progetto di Sam Altman e soci continua a crescere. Un esempio intrigante è DarkBERT, un’IA che esiste già dal 2019 e che serve per studiare il Dark Web.
Che cos’è DarkBERT?
DarkBERT viene descritto nel paper ufficiale, pubblicato da un gruppo di esperti ricercatori sudcoreani, come un modello di linguaggio concepito per esplorare il “lato oscuro di Internet”, basato sull’architettura RoBERTa. DarkBERT sfrutta dunque un database originato dalla scansione del Deep Web tramite firewall anonimo Tor per analizzare nuovi contenuti pubblicati nel Dark Web ed estrarne altre informazioni utili.
I ricercatori con i primi test hanno mostrato che l’IA supera altri modelli di linguaggio di grandi dimensioni nell’analisi dei luoghi più remoti e pericolosi del World Wide Web, consentendo così ai ricercatori in ambito cybersecurity e alle forze dell’ordine di penetrare più in profondità e impedire attività illegali.
Nel paper non si parla di un chatbot, sia chiaro, ma potrebbe diventare l’approccio futuro utilizzato dalle autorità competenti per effettuare ricerche più rapide e trovare in men che non si dica qualsiasi nuovo pericolo presente nel Dark Web, dalla compravendita di armi e droghe a forum per hacking e scambio di criptovalute. Come con altri LLM, la pubblicazione del paper non significa che DarkBERT sia un progetto finito. Ergo, ulteriore formazione e la messa a punto possono continuare a migliorare i suoi risultati. Resta da vedere come verrà utilizzato.