La teoría del control óptimo se utiliza en gran medida tanto en ciencia como en ingeniería. Es una técnica de optimización matemática que se usa comúnmente en la creación de políticas de control. Lev Pontryagin, junto con su equipo en la ex Unión Soviética, y el estadounidense Richard Bellman son los principales responsables de la teoría del control óptimo. El objetivo general de la teoría es utilizar varios métodos de análisis para determinar los parámetros de un sistema mediante la realización de procesos de prueba y error.
La teoría del control óptimo resulta útil cuando se intenta resolver problemas de optimización de tiempo continuo. La teoría aborda un problema determinando una ley de control para un sistema hipotético con el fin de lograr un nivel de optimalidad. El control óptimo consiste en un conjunto de varias ecuaciones, que describen las trayectorias de las variables que reducen al mínimo el costo funcional. El costo funcional es básicamente una función de variables relacionadas con el estado y el control. La teoría del control óptimo hace uso del principio máximo de Pontryagin, que generalmente establece que se puede resolver el problema de optimización P con el uso de una función hamiltoniana H durante un período, que es una condición necesaria. La teoría también se puede derivar con la ecuación de Hamilton-Jacobi-Bellman.
Para ayudar a una persona a comprender la teoría del control óptimo, se usa comúnmente el ejemplo de “conducir su automóvil por una carretera con colinas”. Imagínese viajando en un automóvil por una carretera escarpada en línea recta. La teoría puede determinar cómo se debe acelerar para minimizar el tiempo de viaje absoluto. En tal caso, el “sistema” está formado por el vehículo y el camino rocoso y el criterio de optimización es que uno alcance la minimización del tiempo de viaje. Se sabe que tales problemas incluyen limitaciones (por ejemplo, limitación de combustible, límites de velocidad). Otra cuestión puede ser encontrar la manera de que el automóvil optimice su consumo de combustible mientras se ve obligado a completar un determinado recorrido en un plazo determinado.
Otro ejemplo del uso de la teoría del control óptimo es la resolución de la costate o precio sombra. Consiste en el valor marginal de expandir la variable de estado. Habiendo resuelto eso, el valor óptimo para el control puede formar una ecuación diferencial condicionada a la conciencia de la costate. Es común que esta estrategia resuelva las regiones que describen el control óptimo y aíslan los valores de elección reales en el tiempo.