Scraper, il plugin di ChatGPT che estrae dati dai siti Web

Scraper, il plugin di ChatGPT che estrae dati dai siti Web

Scrapper è un potente plugin per ChatGPT che consente di estrarre dati strutturati da qualsiasi sito Web in modo rapido e semplice.
Scraper, il plugin di ChatGPT che estrae dati dai siti Web
Scrapper è un potente plugin per ChatGPT che consente di estrarre dati strutturati da qualsiasi sito Web in modo rapido e semplice.

La quantità di plugin disponibili per ChatGPT sta aumentando molto rapidamente, come anche il numero di strumenti che si basano sul modello di linguaggio di OpenAI. Recentemente, ad esempio, abbiamo osservato il caso di Monica, l’assistente IA alimentato da ChatGPT e perfettamente operativo su tutti i siti Web. Il chatbot non è però esclusivamente un assistente virtuale: si tratta di uno strumento estremamente versatile, specialmente ora che grazie all’abbonamento Plus si accede ad utility aggiuntive particolarmente utili. Il plugin più utilizzato al mondo con ogni probabilità è quello per la navigazione online, ma attenzione anche a Scraper. Di cosa si tratta? Scopriamolo assieme, ma solo dopo avere letto come utilizzare i plugin di ChatGPT.

Cos’è Scraper?

Scraper è un plug-in di ChatGPT Plus che permette di estrarre informazioni dai siti Web. Non pensate di estrapolare dati segreti, sia ben chiaro. Tuttavia, per ottenere uno “scheletro” del portale d’interesse, ovvero un riassunto di tutti i numeri e tutte le stringhe di testo fondamentali visibili, è forse lo strumento più potente in circolazione.

Il web scraping resta un’attività discutibile, in quanto permette di estrapolare potenzialmente anche dati personali per rielaborarli a proprio piacimento. Si tratta di un metodo usato dalla stessa OpenAI per addestrare GPT-4, al fine di ottenere informazioni da siti Web per potenziare l’algoritmo. Non si tratta di un processo illegale: fintanto che i dati sono disponibili online al pubblico e vengono usati per fini statistici non si incorre in alcuna infrazione. Al contrario, se i dati raccolti vengono usati per violare il diritto d’autore o per scopo di lucro, ciò costituisce un illecito.

Nel caso di Scraper e dell’utilizzo tipico non vi è ragione di cui preoccuparsi, in quanto i casi d’uso restano limitati.

Alcuni esempi di utilizzo

L’esempio più semplice illustrato anche da altri utenti che hanno provato Scraper con ChatGPT riguarda lo scraping di YouTube che, sorprendentemente, funziona sempre. Immaginate di dover estrarre tutti i video caricati da un content creator nell’arco di un mese per un’indagine statistica relativa alla sua crescita e alle performance negli ultimi 30 giorni. Ebbene, potete recarvi sul canale YouTube di vostro interesse e usare Scraper per estrarre i titoli, la quantità di visualizzazioni e la data di pubblicazione di ciascun video nell’ultimo mese. Un esempio lo potete vedere nello screenshot sottostante.

Scraper plugin di ChatGPT estrae dati video YouTube da un canale

Come potete vedere, con un prompt chiaro e conciso – che richiede ovviamente l’inserimento del link al canale YouTube, anche con filtri già inseriti – è possibile estrarre una lista numerata di titoli, visualizzazioni e data di upload. Scraper, infine, richiede all’utente se sono necessarie altre informazioni riguardo i video stessi o altri filmati presenti nel medesimo canale. Naturalmente, la lista può essere posta in una pratica tabella sfruttando le funzionalità già presenti normalmente su ChatGPT. Così facendo bastano pochi click per copiare e incollare le informazioni su Microsoft Excel o altri fogli di lavoro.

Un altro esempio intrigante riguarda lo scraping dei siti di notizie. In poche parole si può lasciare carta bianca a Scraper e ChatGPT nell’estrapolazione di titoli, descrizione, riassunto e data di pubblicazione di una notizia pubblicata su un sito specifico.

Scraper plugin di ChatGPT per estrarre dati da sito notizie

Attenzione però ai limiti del plug-in, in quanto il fenomeno del web scraping viene bloccato da molti portali che si oppongono alla pratica. Di conseguenza, Scraper non funzionerà su tutte le pagine Internet a causa dei termini di servizio da esse imposti. Inoltre, non funziona nemmeno sui siti Web che caricano i dati in modo dinamico. Cosa significa? Che questo strumento non riesce a estrapolare tutte le informazioni dal vasto numero di portali che caricano articoli, post, video e quant’altro man mano che si scorre la pagina verso il basso. Purtroppo Scraper non supporta questa funzionalità, tantomeno riesce a cliccare su un contenuto per ottenere più dettagli.

Al netto di questi blocchi imposti dai gestori dei siti Web stessi, Scraper resta un ottimo strumento che rende molto più pratica l’estrazione di numeri e descrizioni utili per scopi statistici o di ricerca, facilitando queste attività e facendo risparmiare molto tempo.

Come installare Scraper

Scraper pagina download plugin ChatGPT

Per installare Scraper bisogna anzitutto essere abbonati a ChatGPT Plus e abilitare i plug-in su GPT-4 tramite le funzionalità Beta in anteprima. Dal negozio di plug-in, dunque, basta cercare “Scraper” nella barra apposita e cliccare sul pulsante per l’installazione. Non serve altro! È un processo molto intuitivo, la cui barriera unica è costituita dal prezzo dell’abbonamento a Plus. Ricordiamo, a tale proposito, che è pari a 20 dollari al mese ma porta vantaggi importanti agli utenti. Oltre all’uso dei plug-in, infatti, si ottengono l’accesso prioritario a ChatGPT e tempi di risposta più rapidi, assieme all’accesso in anteprima a nuove funzionalità.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
10 lug 2023
Link copiato negli appunti