Die Theorie der optimalen Kontrolle wird sowohl in der Wissenschaft als auch in den Ingenieurwissenschaften weitgehend verwendet. Es handelt sich um eine mathematische Optimierungstechnik, die häufig bei der Erstellung von Steuerungsrichtlinien verwendet wird. Lev Pontryagin, zusammen mit seinem Team in der Ex-Sowjetunion, und der Amerikaner Richard Bellman sind vor allem für die Theorie der optimalen Kontrolle verantwortlich. Das allgemeine Ziel der Theorie besteht darin, verschiedene Analysemethoden zu verwenden, um die Parameter eines Systems durch Versuch-und-Irrtum-Verfahren zu bestimmen.
Die Optimalsteuerungstheorie ist praktisch, wenn man versucht, zeitkontinuierliche Optimierungsprobleme zu lösen. Die Theorie geht ein Problem an, indem sie ein Kontrollgesetz für ein hypothetisches System bestimmt, um ein Optimum zu erreichen. Die optimale Steuerung besteht aus einem Satz verschiedener Gleichungen, die die Pfade der Variablen beschreiben, die das Kostenfunktional auf ein Minimum bringen. Das Kostenfunktional ist im Wesentlichen eine Funktion von Variablen, die sich auf Zustand und Steuerung beziehen. Die optimale Kontrolltheorie verwendet das Pontryaginsche Maximumprinzip, das allgemein besagt, dass man das Optimierungsproblem P mit der Verwendung einer Hamiltonschen Funktion H über eine Periode lösen kann, was eine notwendige Bedingung ist. Die Theorie kann auch mit der Hamilton-Jacobi-Bellman-Gleichung abgeleitet werden.
Um einer Person zu helfen, die Theorie der optimalen Steuerung zu verstehen, wird häufig das Beispiel „Fahren Ihres Autos durch eine hügelige Straße“ verwendet. Stellen Sie sich vor, Sie fahren in einem Auto geradeaus auf einer zerklüfteten Straße. Die Theorie kann bestimmen, wie man beschleunigen sollte, um die absolute Reisezeit zu minimieren. In einem solchen Fall besteht das „System“ aus dem Fahrzeug und der steinigen Straße und das Optimalitätskriterium ist das Erreichen der Minimierung der Fahrzeit. Es ist bekannt, dass solche Probleme Beschränkungen (z. B. Kraftstoffbegrenzung, Geschwindigkeitsbegrenzungen) umfassen. Eine andere Frage kann sein, einen Weg zu finden, wie das Auto seinen Kraftstoffverbrauch optimieren kann, während es verpflichtet ist, einen bestimmten Kurs in einer bestimmten Zeit zu absolvieren.
Ein weiteres Beispiel für die Anwendung der Optimalsteuerungstheorie ist die Lösung des Kosten- oder Schattenpreises. Sie besteht aus dem Grenzwert der Erweiterung der Zustandsvariablen. Nachdem dies gelöst wurde, kann der optimale Wert für die Kontrolle eine Differentialgleichung bilden, die von der Kenntnis des Kostates abhängig ist. Es ist üblich, dass diese Strategie nach Regionen auflöst, die die optimale Steuerung beschreiben und die tatsächlichen Auswahlwerte zeitlich abgrenzen.