Con il recente boom dell’intelligenza artificiale in tutto il mondo, tra video deepfake e testi scritti da ChatGPT o altri modelli di linguaggio avanzati, si presenta il nuovo pericolo della distinzione dei contenuti autentici e quelli realizzati dai computer. Senza il giusto aiuto, o la giusta cautela e attenzione nell’esame dei documenti, diventa praticamente impossibile distinguere un output umano da un output generato da IA.
In nostro soccorso arrivano degli strumenti sperimentali che cercano di identificare se un testo è stato prodotto a ChatGPT o servizi analoghi come il chatbot Claude di Anthropic. Vediamo, pertanto, in questa occasione come funziona concretamente il rilevamento dell’intelligenza artificiale.
OpenAI aiuta a riconoscere ChatGPT
OpenAI dà, OpenAI toglie. La stessa società che ha creato il fenomeno del momento ha pensato a fornire anche uno strumento molto utile nella determinazione dell’origine di un testo. Tuttavia, gli sviluppatori avvertono che questo servizio può sbagliare; insomma, mai fidarsi ciecamente del verdetto!
Accessibile tramite il sito dedicato, il cosiddetto “AI Text Classifier” permette di copiare un testo lungo almeno 1.000 caratteri in una casella come input, per poi giudicare quanto il testo sia possibilmente un prodotto dell’intelligenza artificiale. I verdetti sono due: “Il classificatore considera il testo come molto improbabilmente generato dall’IA”, oppure “Il classificatore considera il testo come possibilmente generato dall’IA”, naturalmente senza distinguere tra ChatGPT o altri servizi.
In un nostro test abbiamo riscontrato verdetti quasi sempre corretti, con testi generati da ChatGPT riconosciuti immediatamente dallo strumento firmato OpenAI.
Come funziona?
A questo punto la vostra domanda sarà sicuramente la seguente: come operano questi strumenti? Com’è possibile riconoscere i prodotti delle IA? In breve, essi analizzano le probabilità di utilizzo di certe parole da parte dell’intelligenza artificiale, la quale potrebbe basarsi su un vocabolario poco ricco ed essenziale, limitato a termini facilmente comprensibili, comuni nel parlato e senza sinonimi anche desueti. Del resto, un modello di linguaggio è stato addestrato su migliaia di testi per riconoscere e riprodurre scritti già esistenti, cercando di adattarli alla richiesta e al contesto fissati dall’utente.
L’algoritmo degli strumenti di controllo, peraltro, proprio come il caro vecchio T9 – o i suggerimenti delle tastiere per smartphone – cerca di prevedere il testo e completare le frasi dopo avere analizzato le prime parole. Man mano che il documento viene letto nella sua interezza, a seconda della sua prevedibilità viene restituito un verdetto più o meno positivo, confermando o meno l’ipotesi di scrittura dei testi da parte delle IA.
Altri esempi di analizzatori di testo
Un altro tool particolarmente utilizzato oggi da docenti, ricercatori e studenti che vogliono evitare accuse di plagio o preferiscono verificare l’origine umana degli elaborati, è l’AI Detector di Content at Scale. Utilizzarlo è estremamente semplice, in quanto richiede semplicemente l’inserimento del testo nella casella di input e la pressione del pulsante “Check For AI Content”, ovvero “Effettua controllo per contenuti IA”. Il servizio di Content at Scale evidenzia anche ogni riga plausibilmente scritta da un’IA.
La stessa Content at Scale spiega dunque che il suo rilevatore è addestrato su miliardi di pagine di dati e può prevedere con precisione le scelte di parole più probabili da parte dell’intelligenza artificiale, proprio come illustrato sopra.
Altrimenti, Originality è un’alternativa focalizzata su testi utilizzati in ambito industriale o commerciale, il cui utilizzo è identico alle opzioni precedentemente illustrate. Una volta copiato l’articolo d’interesse e avviato il controllo, si ottiene un valore percentuale indicando le probabilità che l’IA abbia prodotto tale contenuto.
Si può effettuare un controllo “manuale” su ChatGPT?
Questi strumenti consentono di accedere a un verdetto pressoché immediato, senza doversi scervellare per comprendere se si tratti di un lavoro svolto dall’IA o da un essere umano. Nei momenti in cui tali servizi risultano inaccessibili, però, dev’essere svolto un controllo “alla vecchia maniera”. Non sarà possibile identificare eventuali casi di plagio, ma l’IA è piuttosto riconoscibile.
Tendenzialmente, un testo scritto da ChatGPT è davvero banale, contiene numerose ripetizioni e non si avvale dell’intero vocabolario della lingua utilizzata, specie se non si tratta dell’inglese. Per quanto possa risultare ben steso, il documento è spesso troppo lineare e non sostituisce certi termini con sinonimi più consoni al contesto, consegnando così un saggio tutt’altro che ricco e accattivante.
Proprio come Content at Scale e Originality, seppur con i nostri limiti, possiamo perciò distinguere un testo prodotto dai chatbot o, almeno, sospettare una produzione non umana. Se avete una padronanza avanzata dell’italiano e una certa oculatezza, allora il compito diventa ancora più facile da portare a termine. Capire se un testo è scritto da ChatGPT non è impossibile, serve soltanto uno sguardo molto attento e, magari, un vocabolario sotto mano. Per altri eventuali dubbi, fortunatamente, Internet è sempre disposto ad aiutarci.