La validación cruzada es un método utilizado en química y en una amplia gama de otros campos científicos para comparar los resultados de múltiples métodos experimentales con el mismo objetivo. Idealmente, la validación cruzada validará ambos métodos experimentales al devolver los mismos resultados. Los diferentes resultados pueden indicar errores humanos o errores en el diseño experimental. Las diferencias pueden usarse para identificar errores y refinar uno o más de los métodos experimentales hasta que se obtengan resultados consistentes y repetibles.
Para que la validación cruzada tenga éxito, generalmente es necesario que los investigadores sepan que uno de los métodos arroja resultados precisos. El objetivo, entonces, es hacer que el método nuevo y no confirmado, o el comparador, devuelva resultados idénticos a los del método conocido, o la referencia. Si se sabe que ninguno de los métodos es preciso, probablemente se puedan ajustar para obtener los mismos resultados, pero aún no hay garantía de que esos resultados sean correctos.
Los investigadores a menudo utilizan la validación cruzada cuando introducen un método experimental nuevo y más eficiente que está destinado a reemplazar un método anterior. El nuevo método solo es útil si se puede utilizar para el mismo propósito que el método que pretende reemplazar. La validación cruzada se utiliza para garantizar que el nuevo método sea tan eficaz como el anterior y que la eficiencia no se obtenga a costa de la precisión.
Los resultados de los experimentos utilizados para la validación cruzada se pueden preparar cualitativa o cuantitativamente en función de la naturaleza del experimento. El éxito de algunos experimentos químicos sencillos se puede evaluar mediante señales visuales sencillas, como el cambio de color. Un nuevo método que da como resultado el mismo cambio de color puede, en algunos casos, considerarse exitoso. Sin embargo, la mayor parte de la investigación científica moderna se basa en gran medida en métodos cuantitativos. Como tal, la información cuantitativa debe compararse y las diferencias en los datos numéricos se utilizan para juzgar el éxito o el fracaso de un experimento de validación.
Gran parte de los resultados de la validación cruzada se basan en grandes volúmenes de datos estadísticos más que en información cualitativa o en uno o dos valores como la temperatura o la acidez. Para tales datos estadísticos, no existe un único número específico o conjunto de números que sea correcto, mientras que todos los demás son incorrectos. El éxito de una validación cruzada se juzga en función de si los datos devueltos caen dentro de un cierto umbral de error aceptable. En tales experimentos, algunos de los valores devueltos pueden ser aceptables mientras que otros son erróneos, lo que indica que se deben revisar partes particulares de los métodos probados.