Nel boom dell’AI generativa, i dati sono il nuovo petrolio. Grandi aziende e startup stanno investendo milioni di dollari per ottenere licenze su libri digitali, immagini, video, audio e molto altro da rivenditori di dati, con l’obiettivo di addestrare prodotti AI sempre più performanti (e legali).
Shutterstock ha firmato accordi con i colossi Meta, Google, Amazon e Apple per fornire milioni di immagini destinate all’addestramento dei loro modelli, mentre OpenAI ha stretto intese con diverse testate giornalistiche per allenare i suoi algoritmi sui loro archivi di news. Spesso, però, chi crea e possiede questi dati non vede un centesimo. La startup Vana vuole cambiare lo status quo.
Chi è Vana
Vana è una startup fondata nel 2021 da Anna Kazlauskas e Art Abal. Kazlauskas ha studiato informatica ed economia al MIT, che ha poi lasciato per lanciare una startup di automazione fintech, Iambiq, da Y Combinator. Abal, avvocato d’impresa per formazione e istruzione, è stato associato presso The Cadmus Group, una società di consulenza con sede a Boston, prima di dirigere l’impact sourcing presso la società di data annotation Appen.
I dati personali sono diventati una risorsa preziosissima, e Vana, ben consapevole di ciò, ha deciso di rivoluzionare il modo in cui queste informazioni vengono gestite e utilizzate. Kazlauskas e Abal hanno unito le forze per creare una piattaforma che permetta agli utenti di prendere il controllo dei propri dati e sfruttarli in modi nuovi per trarne un profitto.
Il tesoro dei dati personali
L’idea alla base di Vana è semplice ma potente: permettere agli utenti di aggregare i propri dati da diverse fonti, come chat, registrazioni vocali e foto, in set di dati personalizzati. Questi set di dati possono poi essere utilizzati per addestrare modelli di AI generativa, creando esperienze su misura per ogni singolo utente.
L’API di Vana collega i dati personali di un utente provenienti da diverse piattaforme (come Instagram, Facebook e Google) in un unico profilo digitale. Questo consente alle applicazioni che utilizzano Vana di accedere immediatamente ai dati e al modello AI personalizzato di ciascun utente.
In questo modo è più semplice per l’utente iniziare ad usare l’app, senza preoccuparsi dei costi computazionali. L’obiettivo è permettere agli utenti di portare i propri dati personali dai “walled garden” alle applicazioni partner, così da offrire un’esperienza personalizzata fin dal primo utilizzo.
Creare un account Vana è semplice: dopo la conferma email, si possono allegare dati (selfie, descrizione, note vocali) al proprio profilo digitale. Si può poi esplorare la libreria di app che usano i dati e l’API di Vana, che vanno da chatbot simili a ChatGPT a generatori di profili per app di incontri.
L’importanza della sicurezza e la privacy
In un’epoca in cui la consapevolezza sulla privacy dei dati è in aumento e gli attacchi ransomware sono all’ordine del giorno, è naturale chiedersi se sia saggio affidare le proprie informazioni personali a una startup. Tuttavia, Vana mette la sicurezza e la privacy degli utenti al primo posto.
Gli utenti hanno il pieno controllo sui propri dati e possono scegliere di auto-ospitarli invece di memorizzarli sui server dell’azienda. Inoltre, possono decidere come condividere i propri dati con app e sviluppatori. Vana, essendo orientata al profitto, guadagna attraverso abbonamenti mensili e tariffe per le transazioni di dati, il che la disincentiva dallo sfruttare gli utenti e i loro dati personali.
Vana lancia il “Reddit Data DAO”
Vana afferma di non vendere direttamente i dati degli utenti alle aziende di intelligenza artificiale, ma vuole dare agli utenti stessi la possibilità di farlo, se lo desiderano, con i loro post su Reddit.
Questo mese, infatti, ha lanciato il “Reddit Data DAO” (Organizzazione Autonoma Digitale), un programma che aggrega i dati Reddit di più utenti (compresi karma e cronologia post) e permette loro di decidere collettivamente come utilizzare i dati combinati. Dopo essersi iscritti con un account Reddit, aver richiesto a Reddit i propri dati e averli caricati nel DAO, gli utenti ottengono il diritto di votare insieme agli altri membri del DAO su decisioni come la licenza dei dati aggregati a società di AI generativa, condividendo i profitti.
È una risposta alle recenti mosse di Reddit per monetizzare i dati sulla sua piattaforma. In precedenza Reddit non consentiva alle aziende di AI generativa l’accesso ai post e alle community.