La indexación automática es el acto de utilizar un programa o algoritmo informático para examinar archivos, documentos y sitios web en busca de palabras clave. Esto se puede utilizar en programas individuales, pero también es un algoritmo popular para los motores de búsqueda, que tienen que rastrear varios sitios web para determinar su información. Una ventaja de la indexación automática es que la computadora puede indexar y buscar fácilmente un documento mucho más rápido que una persona. La desventaja es que una persona tiene que hacer el indexador y es posible que el indexador pierda puntos clave debido a una programación defectuosa.
Hay muchos archivos que se encuentran en Internet, computadoras y dispositivos de almacenamiento. Cada uno de estos documentos generalmente se refiere a un tema específico, y las palabras recurrentes revelarán el tema de los documentos. Por ejemplo, un documento médico normalmente utilizará términos médicos. Un programa de indexación automática revisará el documento y clasificará el documento en función de estas palabras.
Algunos programas individuales, como los lectores de documentos, pueden realizar una indexación automática. Cuando se trata de buscar en una red local, esta función generalmente se incluye con bases de datos que pueden ser difíciles de buscar manualmente. El lugar más popular para encontrar la indexación automática es un motor de búsqueda en línea, porque el motor de búsqueda tiene que hacer coincidir la palabra clave del usuario, o el término de búsqueda, con todos los sitios web existentes. Sin esta función, sería difícil para las personas encontrar sitios web relevantes.
La ventaja más obvia de la indexación automática es que les quita el trabajo a los humanos, que no pueden escanear un documento tan rápido como lo hace una computadora. La computadora también puede clasificar los documentos después de escanearlos, por lo que los usuarios no tendrán que realizar este tedioso trabajo. Si bien es posible que los usuarios deban verificar la organización en busca de errores, debido a que un indexador a veces puede perder un documento, esto aún es más fácil que hacer todo manualmente.
Si bien existen muchas ventajas, también existen desventajas al usar la indexación automática. Como con cualquier programa o algoritmo, una persona tiene que crear el programa. Esto significa que el programador tiene que decirle al indexador cómo emparejar palabras, lo que puede dar lugar a inexactitudes como resultado de una mala programación. El indexador también puede ser incapaz de distinguir ciertas palabras, o puede tener una gran cantidad de inexactitudes debido a palabras clave extrañas. Por ejemplo, un documento médico que analiza los peligros de los cosméticos puede clasificarse incorrectamente como documento de belleza y maquillaje.