Warning: is_file(): open_basedir restriction in effect. File(/etc/wordpress/config.ini) is not within the allowed path(s): (/var/www/vhosts/spiegato.com/:/tmp/) in /var/www/vhosts/spiegato.com/httpdocs/Spiegato.com/wp-content/mu-plugins/ionos-assistant/inc/config.php on line 213
Che cos'è un raschietto per schermo? - Spiegato

Che cos’è un raschietto per schermo?

Uno screen scraper è un programma per computer che raccoglie dati basati sui caratteri dall’output del display di un altro programma. Gli screen scraper possono estrarre i dati che stanno cercando e presentarli in un formato più ricco, ad esempio con grafici o tabelle, o semplicemente indicizzare i dati per l’archiviazione. Esistono molti altri nomi per uno screen scraper, tra cui scraper di siti Web, content miner, ripper di siti Web, estrattore di siti Web, raccoglitore di dati automatizzato e raschietto HTML.

Uno screen scraper cercherà nel codice di un sito Web e filtrerà il codice estraneo presente per fornire una presentazione gradevole al browser finale. Tale codice è necessario per visualizzare l’intera pagina nel layout previsto, ma un raschietto sta semplicemente cercando dati utili. Questi dati vengono raccolti e presentati come un semplice database, senza le campane e i fischietti del codice HTML originale fornito.

Un buon esempio di screen scraper in azione è con gli spider dei motori di ricerca. Questi ragni accedono a centinaia di migliaia di siti Web, ciascuno dei quali contiene numerose pagine all’interno. I dati delle parole chiave di questi siti vengono raccolti e indicizzati, quindi presentati all’utente finale come risultati del motore di ricerca.

La maggior parte degli screen scraper perlustra la codifica HTML di un sito Web per ottenere le loro informazioni, ma possono anche cercare altri linguaggi di scripting come JavaScript o PHP. I dati estratti possono quindi essere presentati come HTML stesso, in modo che l’utente possa accedervi con il proprio browser Web o archiviati come dati di testo a cui l’utente può accedere offline.

Le aziende utilizzano screen scraper per estrarre i dati da una varietà di siti Web relativi a parole chiave al fine di generare grafici, tabelle, fogli di calcolo e dati di confronto da utilizzare in report e presentazioni. Lo screen scraper consente di risparmiare una quantità straordinaria di tempo, poiché un dipendente che svolge la stessa attività dovrebbe cercare i siti pertinenti, fare clic sui collegamenti e navigare in ciascun sito singolarmente per trovare e registrare i dati applicabili di cui ha bisogno. Uno screen scraper può essere utilizzato anche quando le informazioni sono memorizzate su un sistema a cui non è più possibile accedere a causa di problemi di compatibilità con hardware o software più recenti.

Gli screen scraper possono essere sia una benedizione che una maledizione per i proprietari di siti e i navigatori del web. Sebbene forniscano un servizio assolutamente funzionale per aziende, motori di ricerca e altri, uno screen scraper può essere utilizzato anche per scopi meno che altruistici. Ad esempio, le aziende o gli individui che utilizzano lo spam come metodo pubblicitario possono utilizzare uno screen scraper per estrarre indirizzi e-mail dai siti Web.
Mentre uno screen scraper può essere uno strumento utile, c’è un certo dibattito tra la comunità web sulla legalità e l’etica quando li si usa. I problemi di copyright diventano sfocati quando uno screen scraper estrae il duro lavoro di qualcuno e lo presenta in un altro formato per un altro sito Web e quei siti che dipendono dalla pubblicità per generare entrate hanno problemi quando i loro annunci vengono scartati dallo screen scraper. Di conseguenza, alcuni proprietari di siti Web hanno iniziato a implementare strumenti che impediranno lo scraping dei loro siti.