¿Qué son las frases estadísticamente improbables?

Frases estadísticamente improbables, o SIP, es una tecnología de búsqueda desarrollada por Amazon.com para buscar en el contenido de los libros frases contenidas en ellos que probablemente sean únicas o que ocurran con frecuencia. Esto es parte del programa de tecnología patentado Search Inside! ® de Amazon. Básicamente, Search Inside® le da a Amazon acceso al texto parcial o completo de un libro, de modo que ciertas frases se pueden usar para identificar ese libro si se usan frases estadísticamente improbables en una búsqueda.

El nombre de esta tecnología es un poco confuso. Cuando realiza una búsqueda, desea que lo que está buscando coincida estrechamente. Al identificar una frase única en un libro, si usa esa frase para buscar, es improbable que su búsqueda incluya algo que no desea. Si está buscando un libro específico y no puede recordar el título, pero puede recordar una cita de él, puede usar la cita para buscar el libro.

Alternativamente, es posible que desee buscar un tema específico, dentro de un tema más amplio. Por ejemplo, si desea buscar un libro con consejos profesionales, pero lo que realmente quiere leer es cómo establecer contactos para obtener trabajos, puede buscar «contactos» en lugar de «consejos profesionales». Inmediatamente, algunas de las búsquedas más relevantes aparecen en la página de resultados de búsqueda de Amazon, incluidos libros como Cava tu pozo antes de tener sed: el único libro sobre redes que necesitarás.

Si ha buscado con este tipo de frases estadísticamente improbables, puede notar que puede obtener resultados que no coinciden exactamente. Por ejemplo, el primer resultado de búsqueda para redes no es para redes profesionales, sino para información de redes informáticas y tecnológicas. Puede hacer mejores frases estadísticamente improbables si es más específico. Por ejemplo, puede obtener mejores resultados al buscar en redes profesionales o redes laborales.

Las frases estadísticamente improbables son en realidad frases probables, ya que es probable que una frase exclusiva de un libro de Search Inside! ® encabece la lista de cosas que busca. Por ejemplo, podría ingresar una línea de Shakespeare de un soneto de Shakespeare para mostrar libros sobre Shakespeare. Esto no siempre funciona bien, ya que algunas citas muy conocidas se utilizan en muchos otros libros como títulos. No encontrará Hamlet si busca «Ser o no ser». Tampoco encontrarás a Macbeth con frases estadísticamente improbables como “¡Fuera! Maldito lugar «. De hecho, bajo este último término, el primer libro que encontrará es uno sobre eliminación de manchas.

El uso de frases estadísticamente improbables también es una forma de buscar contenido web, y los rastreadores web pueden usar tecnología similar para que las personas puedan buscar de manera más efectiva y específica ciertas líneas únicas. No es una tecnología perfecta ya que un rastreador web no necesariamente evalúa el contenido. Puede buscar la repetición de palabras clave que permita a las personas encontrar piezas con el mayor número de repeticiones de palabras clave. No todos los libros en Amazon tienen la tecnología Search Inside! ®, pero esta parece ser la tendencia. En última instancia, incluso si el sistema es ligeramente imperfecto, podría reducir el tiempo de búsqueda.