Frasi statisticamente improbabili, o SIP, è una tecnologia di ricerca sviluppata da Amazon.com per cercare nel contenuto dei libri le frasi in essi contenute che potrebbero essere uniche o che si verificano spesso. Questo fa parte del programma tecnologico brevettato Search Inside!® di Amazon. In sostanza, Search Inside® consente ad Amazon di accedere al testo parziale o completo di un libro, in modo che determinate frasi possano essere utilizzate per identificare quel libro se in una ricerca vengono utilizzate frasi statisticamente improbabili.
Il nome di questa tecnologia è un po’ confuso. Quando esegui una ricerca, vuoi che ciò che stai cercando corrisponda da vicino. Identificando una frase univoca in un libro, se usi quella frase per cercare è improbabile che la tua ricerca elencherà qualcosa che non desideri. Se stai cercando un libro specifico e non ricordi il titolo ma ricordi una citazione da esso, puoi utilizzare la citazione per cercare il libro.
In alternativa, potresti voler cercare un argomento specifico, all’interno di un argomento più ampio. Ad esempio, se volevi cercare un libro con consigli sulla carriera, ma ciò di cui volevi veramente leggere era come fare rete per i lavori, potresti cercare “networking” invece di “consigli di carriera”. Immediatamente, alcune delle ricerche più pertinenti vengono visualizzate nella pagina dei risultati di ricerca di Amazon, inclusi libri come Scavare bene prima di avere sete: l’unico libro di rete di cui avrai mai bisogno.
Se hai cercato con questi tipi di frasi statisticamente improbabili, potresti notare che puoi ottenere risultati che non corrispondono esattamente a una buona corrispondenza. Ad esempio, il primo risultato di ricerca per il networking non è per il networking professionale, ma per le informazioni sulla rete di computer e tecnologia. Puoi migliorare le frasi statisticamente improbabili essendo più specifici. Ad esempio, ottieni risultati migliori cercando in networking di carriera o in rete di lavoro.
Le frasi statisticamente improbabili sono in realtà frasi probabili, poiché è probabile che una frase unica per un libro Search Inside!® sia in testa all’elenco delle cose che cerchi. Ad esempio, potresti inserire un verso di Shakespeare da un sonetto di Shakespeare per richiamare i libri su Shakespeare. Questo non funziona sempre bene poiché alcune citazioni molto note sono usate in molti altri libri come titoli. Non troverai Amleto se cerchi “Essere o non essere”. Né troverai Macbeth con frasi statisticamente improbabili come “Fuori! Maledetto posto.” Infatti, sotto quest’ultimo termine, il primo libro che troverai è quello sulla rimozione delle macchie.
L’utilizzo di frasi statisticamente improbabili è anche un modo per cercare contenuti Web e i crawler Web possono utilizzare una tecnologia simile in modo che le persone possano cercare in modo più efficace e specifico determinate righe univoche. Non è una tecnologia perfetta poiché un web crawler non valuta necessariamente il contenuto. Può cercare la ripetizione di parole chiave che consente alle persone di trovare pezzi con il numero maggiore di ripetizioni di parole chiave. Non tutti i libri su Amazon hanno la tecnologia Search Inside!®, ma questa sembra essere la tendenza. In definitiva, anche se il sistema è leggermente imperfetto, potrebbe ridurre i tempi di ricerca.