Apriti cielo! Bluesky ha osato proporre agli utenti di condividere i loro dati per addestrare l’AI. Una mossa che ha scatenato un putiferio tra i fedelissimi della piattaforma, che l’hanno vissuta come un vero e proprio tradimento.
In tanti si sentono presi in giro da Bluesky, che aveva promesso mari e monti sulla privacy e ora sembra voler gettare tutto alle ortiche per inseguire il miraggio dell’intelligenza artificiale.
Bluesky, polemiche sull’uso dei dati per l’AI
Jay Graber, la CEO di Bluesky, non ci sta a passare per la cattiva della situazione. In un post su Bluesky, ha spiegato che le aziende di AI “stanno già facendo scraping dei dati pubblici da tutto il web“, Bluesky compreso, visto che tutto ciò che viene pubblicato sulla piattaforma è accessibile come un normale sito web. Quindi, dice Graber, Bluesky sta cercando di regolamentare questa pratica, ispirandosi al file robots.txt che i siti usano per indicare ai crawler quali contenuti possono o meno essere indicizzati.
I dibattiti sull‘addestramento dell’AI e sul copyright hanno riacceso i riflettori sul file robots.txt, mettendo in evidenza un aspetto spesso trascurato: non ha alcun valore legale. In pratica, i crawler possono fregarsene allegramente. Ecco perché Bluesky ci tiene a precisare che il suo standard non avrebbe valore legale, ma solo etico. L’idea è creare un sistema simile a robots.txt, sia nel funzionamento che nelle aspettative: un formato leggibile dalle macchine, che i player “per bene” dovrebbero rispettare, ma che non vincola legalmente nessuno.
Quattro opzioni per gli utenti
Secondo la proposta, nelle impostazioni di Bluesky o delle app basate su ATProtocol, gli utenti potranno scegliere se dare o meno il loro benestare all’uso dei loro dati per quattro scopi: AI generativa, collegamento tra social diversi, dataset massivi e archivi web stile Wayback Machine. Se un utente dice no all’AI, in teoria le aziende che creano i dataset di addestramento dovrebbero farsi da parte, sia quando fanno scraping del web, sia quando pescano direttamente dal social.
Un buon tentativo, ma con dei limiti
La proposta di Bluesky non è così insensata, dopotutto. Alcuni utenti esperti di privacy, infatti, fanno notare che è un modo per gli utenti di avere voce in capitolo sullo scraping selvaggio dell’AI. Ma anche vero che è una misura zoppa. Ci si affida alla buona volontà delle aziende, che spesso non si fanno troppi scrupoli quanto a robots.txt e avvisi di copyright.