La normalización de la base de datos se utiliza en un sistema de gestión de bases de datos (DBMS), específicamente con bases de datos relacionales, para disminuir la información redundante y, por lo tanto, minimizar las anomalías en los datos. Las anomalías pueden ocurrir a partir de información que está mal agrupada o es redundante y pueden causar una variedad de efectos, como la inserción incorrecta de datos o la eliminación de un grupo completo de datos. Al usar la normalización de la base de datos, se evitan estas anomalías y, por lo general, se libera memoria para que la base de datos pueda funcionar de manera más eficiente. Las funciones de normalización deben usarse periódicamente, aproximadamente una vez a la semana, para mantener la base de datos actualizada y libre de problemas inesperados.
Nadie crea una base de datos relacional para tener datos redundantes a propósito, pero esto suele suceder a pesar del mejor esfuerzo del diseñador de la base de datos. Por ejemplo, con una base de datos de empleados, un empleado puede aparecer en varias tablas. Cuando la redundancia ocurre a gran escala, surgen anomalías. Los administradores de bases de datos generalmente no pueden capturar todos los datos redundantes, por lo que la normalización de la base de datos es la mejor manera de corregir este problema.
La primera tarea de la normalización de la base de datos es borrar o mover información repetida. Si la información no es necesaria, se eliminará de la base de datos. Para los datos que se necesitan en otras tablas, la normalización busca crear mejores tablas relacionales. Las funciones de normalización descompondrán tablas grandes, corregirán y mejorarán las relaciones entre los datos y aislarán la información para facilitar la modificación de datos en la base de datos. Al restar los datos que se repiten, la memoria generalmente se libera, lo que permite que la base de datos funcione de manera más fluida y rápida.
Las anomalías ocurren por negarse u olvidarse de normalizar la base de datos y pueden inutilizar la información. Una anomalía de actualización es cuando alguien actualiza los datos, pero en lugar de cambiar los datos de destino, la base de datos creará un nuevo registro que es altamente redundante. Con una anomalía de inserción, se agrega un registro a la base de datos, pero no se puede agregar nada debajo del nuevo registro. Las anomalías de eliminación eliminarán aleatoriamente un registro. Estas son solo algunas anomalías comunes que ocurren si la base de datos no está normalizada.
No existe un estándar firme que indique a un administrador cuándo debe usar las funciones de normalización para garantizar la eficacia de la base de datos. Programar la normalización de la base de datos una vez a la semana suele ser lo mejor porque esto evita que toda la nueva información agregada durante la semana experimente anomalías. Es probable que las bases de datos más pequeñas se puedan normalizar una vez al mes, y las bases de datos muy grandes deben realizarse dos veces por semana porque una mayor cantidad de datos conlleva una mayor probabilidad de anomalías. Sin embargo, no existe un estándar, por lo que el administrador de la base de datos normalmente elegirá un horario que crea que es mejor para la base de datos.