Che cos’è un sito di raschiamento?

Un sito scraper è un sito Web che estrae contenuto da altre fonti e lo ripubblica, in genere senza attribuzione. Tali siti vengono gestiti per una serie di motivi e sono motivo di grande preoccupazione per molti legittimi produttori di contenuti su Internet, poiché pongono una serie di problemi. La maggior parte dei siti di scraper viola la legge sul copyright ristampando il contenuto senza consenso e non accreditando l’autore, e inoltre provocano il caos nei risultati dei motori di ricerca e nelle classifiche dei siti, il che può rendere difficile per gli utenti di Internet trovare i siti che vogliono effettivamente vedere.

La caratteristica principale di un sito scraper è che utilizza mezzi automatizzati per raccogliere contenuti da altri siti. La pratica della raccolta di contenuti è nota come “scraping” e può essere eseguita in diversi modi, dal download di interi siti all’estrazione di contenuti dai feed generati in RSS, XML e Atom a vantaggio dei lettori che desiderano abbonarsi a un sito, piuttosto che visitarlo costantemente per verificare la presenza di nuovo materiale. Una volta raschiato, il contenuto viene rimosso letteralmente e installato su un nuovo sito.

La maggior parte dei siti di scraper viene mantenuta allo scopo di generare entrate pubblicitarie tramite annunci collegati al sito. Le persone possono cercare innocentemente qualcosa, atterrare sul sito di scraper e quindi fare clic sugli annunci per confusione. I siti scraper vengono utilizzati anche nel link farming, una pratica che prevede il mantenimento di più siti che si collegano tutti tra loro, gonfiando così il ranking dei motori di ricerca.

Quando il contenuto viene rubato, frustra il creatore originale sia perché viola la legge sul copyright sia perché il sito scraper può privare il proprietario del contenuto originale delle entrate. Molti webmaster utilizzano una varietà di tecniche nel tentativo di sconfiggere i siti scraper e alcuni hanno chiesto un’azione da parte dei motori di ricerca e delle società pubblicitarie, chiedendo loro di rimuovere i siti scraper o renderli meno redditizi in modo che la pratica sia meno attraente.

Nei casi in cui un sito di scraper attribuisce credito al creatore, ciò può anche danneggiare il creatore facendo sembrare che il suo sito si trovi in ​​un “cattivo quartiere”, con un gran numero di link spam piuttosto che link da siti rispettati. Di conseguenza, le classifiche nei motori di ricerca potrebbero diminuire e il proprietario del sito potrebbe non essere in grado di fare nulla al riguardo, poiché i proprietari del sito non possono controllare chi si collega a loro.

Ottenere un sito scraper per rimuovere contenuti protetti da copyright può essere estremamente impegnativo, poiché molti di questi siti utilizzano strati di sotterfugi per nascondere i loro proprietari. Alcuni webmaster frustrati si rivolgono direttamente alla società che ospita il sito scraper, citando violazioni del copyright e chiedendo l’immediata rimozione del contenuto contestato.
Tecnicamente, anche i motori di ricerca e i siti di aggregazione di notizie potrebbero essere considerati siti scraper. Tuttavia, poiché questi siti sono mantenuti per il bene pubblico e poiché il loro uso di materiale rientra nelle linee guida sull’uso corretto, questi siti non sono generalmente raggruppati con siti di scraper dannosi.