Il web invisibile è l’area nascosta di Internet che non viene cercata automaticamente dai motori di ricerca. Si tratta di informazioni che sono disponibili gratuitamente su Internet, ma che non verranno recuperate dalle normali richieste di ricerca. Le informazioni nascoste nel web invisibile richiedono un po’ più di lavoro per essere trovate.
Il web visibile è un’informazione che puoi vedere o recuperare dai motori di ricerca. Il web invisibile è a volte indicato come il deep web. Se pensi a Internet come a un database gigante, alcune delle informazioni sul database sono più facili da trovare rispetto ad altre. Le informazioni contenute nel Web visibile sono solo una frazione delle informazioni disponibili su Internet.
I database dei motori di ricerca su Internet contengono già enormi quantità di informazioni. Quando digiti una domanda in un motore di ricerca, verrà visualizzato un elenco di possibili pagine che potrebbero rispondere alla tua domanda. È meno costoso per il motore di ricerca visualizzare queste pagine di risposta piuttosto che memorizzare ogni possibile pagina sull’argomento che stai cercando. Inoltre, occupa meno spazio nel database del motore di ricerca.
Pensa ai milioni di persone che usano Internet ogni giorno. Fanno domande ai motori di ricerca, cercano argomenti o semplicemente navigano in rete. È più facile per il database fornire la pagina di risposta piuttosto che accedere direttamente alle pagine web.
Un modo per accedere al materiale sul Web invisibile è semplicemente inserire la parola database dopo la query di ricerca. Se stai cercando vacanze in Irlanda, usa le parole Holidays in Ireland database. Questo indirizzerà il motore di ricerca a controllare i database ricercabili sul tuo argomento. Molti database che memorizzano informazioni hanno la parola database nelle loro pagine Web, rendendoli più facili da trovare.
Ci sono alcune pagine Web che sono sul Web invisibile esclusivamente per motivi tecnici. I database vengono creati utilizzando gli spider. Si tratta di programmi per computer che effettuano ricerche sul Web alla ricerca di informazioni. Tuttavia, i ragni non possono pensare o digitare. Possono saltare da un collegamento all’altro, ma non possono pensare da soli.
Se il ragno si imbatte in una pagina web che necessita di una password di accesso, non ha modo di entrare in quella pagina. Esistono molti siti che richiedono all’utente di accedere e di utilizzare una password per accedere e visualizzare i propri contenuti. Inoltre, se una pagina Web è stata creata senza il solito HTML, che è il linguaggio Web di base, potrebbe non essere sempre facilmente letta. Ad esempio, è possibile accedere a un documento PDF solo come collegamento e non trovarlo facilmente come pagina Web HTML.
Un altro collegamento a cui i ragni non andranno è qualsiasi collegamento con un punto interrogativo. I ragni sono informati di non andare ai collegamenti con un punto interrogativo, in quanto potrebbero essere trappole impostate per irretire i ragni. Il collegamento potrebbe contenere anche script scritti male e quindi potrebbe non essere archiviato nei normali database. Questi collegamenti saranno disponibili solo durante la ricerca nei database sul Web invisibile.
I motori di ricerca vengono aggiornati con sofisticate tecniche di ricerca per accedere al web invisibile. Si pensa che con il tempo la rete invisibile diventerà più facilmente visibile. Fino ad allora, si tratta di usare le capacità intellettuali per interrogare i motori di ricerca e navigare nei link per trovare informazioni.