¿Qué es la selección de acciones?

La selección de acciones es un proceso que implica cómo reaccionará un sistema inteligente diseñado junto a un problema dado. Suele ser un campo estudiado en psicología, robótica e inteligencia artificial. La selección de acciones es sinónimo de toma de decisiones y elección de comportamiento. Los datos recopilados se investigan y desglosan para poder adaptarlos a sistemas artificiales como robótica, videojuegos y programación de inteligencia artificial.

Gran parte de los datos de las ciencias de la vida se pueden observar y experimentar para evocar una respuesta variable. Todas las criaturas vivientes tienen su propia reacción instintiva a la comida, los depredadores y las parejas. Crear un ambiente controlado donde se observe que los animales estudiados siempre realizan diferentes soluciones a diferentes problemas proporciona a los investigadores y programadores una base para el avance de su estudio. Esto, a su vez, ha llevado a los investigadores y programadores a intentar recrear esas respuestas instintivas de manera controlada.

Para los investigadores y programadores, las preguntas más comunes que se utilizan en la selección de acciones se centran en qué hacer a partir de entonces y qué sucede a continuación. Las respuestas, a su vez, pueden reciclarse para un nuevo lote de selección de acciones experimentales. Los mejores ejemplos de selección de acciones se pueden encontrar en juegos y programación de inteligencia artificial. En los juegos de computadora, se puede encontrar en First-Person Shooters (FPS) como Halo y Counter-Strike. Creatures, un juego basado en mascotas, utiliza un motor de inteligencia artificial que puede tomar sus propias decisiones adaptándose a las tareas.

Lo que hace que la selección de acciones sea un campo único es que siempre hay una guía estricta a seguir para tener un nivel aceptable de datos. La guía siempre se basará en un tema que se modela a partir de un humano o un animal. Para la mayoría, si no todos los investigadores y programadores, siempre será necesario colocar un sujeto en un lugar donde el entorno sea impredecible y siempre esté cambiando. El sujeto también deberá reaccionar a tiempo mientras realiza una serie de tareas. También debe interactuar con seres humanos reales con el fin de incorporar un factor de aleatorización.

Con tantos factores aleatorios y una guía estricta a seguir, la investigación nunca termina, ya que siempre habrá un conjunto diferente de circunstancias para cada experimento. Un factor principal que hace que los investigadores y programadores estudien este campo de manera intensiva es el tiempo de respuesta. Con cada experimento exitoso en el que el sujeto haya aprendido una acción, surgirá una vía de acción diferente. Esto, a su vez, lo convierte en un tema más complejo en comparación con una versión anterior.