La teoria del controllo ottimale è ampiamente utilizzata nella scienza e nell’ingegneria. È una tecnica di ottimizzazione matematica comunemente utilizzata nella creazione di politiche di controllo. Lev Pontryagin, insieme alla sua squadra nell’ex Unione Sovietica, e l’americano Richard Bellman sono i principali responsabili della teoria del controllo ottimale. Lo scopo generale della teoria è quello di utilizzare vari metodi di analisi per determinare i parametri di un sistema conducendo processi per tentativi ed errori.
La teoria del controllo ottimo è utile quando si cerca di risolvere problemi di ottimizzazione del tempo continuo. La teoria affronta un problema determinando una legge di controllo per un ipotetico sistema al fine di raggiungere un livello di ottimalità. Il controllo ottimo è costituito da un insieme di varie equazioni, che descrivono i percorsi delle variabili che portano al minimo il funzionale di costo. Il funzionale di costo è fondamentalmente una funzione di variabili relative allo stato e al controllo. La teoria del controllo ottimo fa uso del principio del massimo di Pontryagin, che generalmente afferma che si può risolvere il problema di ottimizzazione P con l’uso di una funzione hamiltoniana H su un periodo, che è una condizione necessaria. La teoria può anche essere derivata con l’equazione di Hamilton-Jacobi-Bellman.
Per aiutare una persona a comprendere la teoria del controllo ottimale, viene comunemente utilizzato l’esempio “guidare l’auto su una strada collinare”. Immagina di viaggiare in un’automobile su una strada scoscesa in linea retta. La teoria può determinare come si dovrebbe accelerare per ridurre al minimo il tempo di viaggio assoluto. In tal caso il “sistema” è costituito dal veicolo e dalla strada sassosa e il criterio di ottimalità è proprio quello di arrivare alla minimizzazione del tempo di percorrenza. È noto che tali problemi includono vincoli (ad es. limitazione del carburante, limiti di velocità). Un’altra domanda potrebbe essere trovare un modo per ottimizzare il consumo di carburante dell’auto mentre è obbligata a completare un determinato percorso in un determinato limite di tempo.
Un altro esempio dell’uso della teoria del controllo ottimo è la risoluzione del prezzo costato o ombra. Consiste nel valore marginale dell’espansione della variabile di stato. Risolto ciò, il valore ottimale per il controllo può formare un’equazione differenziale condizionata alla consapevolezza della costate. È comune che questa strategia risolva per regioni che descrivono il controllo ottimale e isolano i valori di scelta effettivi nel tempo.