Perplexity ha violato le regole di Amazon Web Services?

Perplexity ha violato le regole di Amazon Web Services?

Perplexity ha probabilmente violato i termini di servizio di AWS, effettuando lo scraping dei siti senza rispettare il Robot Exclusion Protocol.
Perplexity ha violato le regole di Amazon Web Services?
Perplexity ha probabilmente violato i termini di servizio di AWS, effettuando lo scraping dei siti senza rispettare il Robot Exclusion Protocol.

Amazon Web Services (AWS) ha avviato un’indagine per verificare se Perplexity ha violato i termini del servizio. Lo scraping non autorizzato dei siti web viene effettuato con un web crawler ospitato su un server dell’azienda di Seattle. Intanto Forbes ha scoperto che il motore di ricerca IA di Perplexity genera risposte sbagliate usando fonti di bassa qualità.

AWS rescinde il contratto?

Wired aveva notato che il web crawler di Perplexity, ovvero PerplexityBot, ignora il Robot Exclusion Protocol. Gli ingegneri di Condé Nast, editore di Wired, hanno bloccato l’accesso tramite il file robots.txt, ma il web crawler della startup effettua ugualmente lo scraping delle pagine dei siti.

Analizzando i log è stato individuato l’indirizzo IP 44.221.181.252 di un server dal quale sono arrivati gli accessi negli ultimi tre mesi. Questo indirizzo corrisponde ad una macchina virtuale Elastic Compute Cloud (EC2) ospitata su AWS. L’azienda di Seattle ha pertanto avviato un’indagine per verificare l’eventuale violazione dei termini del servizio. Un portavoce di AWS ha dichiarato:

I termini di servizio di AWS vietano ai clienti di utilizzare i nostri servizi per qualsiasi attività illegale e i nostri clienti sono tenuti a rispettare i nostri termini e tutte le leggi applicabili.

In teoria, AWS potrebbe rescindere il contratto, ma si tratta di una soluzione estrema. Tra l’altro, uno dei finanziatori di Perplexity è Jeff Bezos.

Una portavoce della startup californiana ha dichiarato che PerplexityBot rispetta il Robot Exclusion Protocol e quindi i termini di servizio di AWS. Ha tuttavia aggiunto che il web crawler non rispetta il blocco aggiunto al file robots.txt, se l’utente inserisce un URL specifico nel prompt.

Forbes ha scoperto che il motore di ricerca IA di Perplexity fornisce risposte considerando come fonte anche i contenuti generati dall’intelligenza artificiale e pubblicati online. Alcune risposte sono quindi “spazzatura” perché non riesce a distinguere tra fonti autentiche e fake. Lo stesso problema è comune ad altri simili servizi. AI Overviews di Google ha consigliato di usare la colla per mantenere il formaggio sulla pizza.

Fonte: Wired
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
28 giu 2024
Link copiato negli appunti