La aplicación de las matemáticas al mundo de los negocios, la economía o las estrategias militares no sólo se refiere a la aplicación de análisis estadísticos u obtención de resultados. Desde principios del siglo XX algunas teorías matemáticas apuntaban que era posible, en base al análisis de las diferentes opciones y estrategias entre varios jugadores, obtener el resultado más beneficioso en una situación de confrontación o riesgo.
la vida merece ser vivida para jugar a los más bellos juegos, y ganar en ellos Platón
Una de las ramas más apasionantes de las matemáticas es la llamada “Teoría de Juegos”. Juegos y matemáticas han estado vinculados a lo largo de toda la historia en forma de acertijos, puzles, juegos de estrategia; seguro que al lector le resultarán familiares juegos como “la torre de Hanoy, el Tangram, el Cubo de Rubik” y muchísimos otros. Durante casi treinta años las columnas sobre juegos y desafíos matemáticos de Martin Gardner en la revista “Scientific American” fueron seguidas por millones de personas, y sus libros, más de setenta, alcanzaron en algunos casos los primeros puestos de popularidad.
Sin embargo, no es de este tipo de juegos de los que hablaremos en este artículo, sino de estrategias, decisiones, dilemas y equilibrios. Aunque unos años antes de 1944 ya se habían publicado algunos trabajos relevantes de matemáticos ilustres sobre la teoría de juegos, no fue hasta la publicación de “Theory of Games and Economic Behavior” de John Von Neumann y Oskar Morgenstern que dicha teoría quedó consolidada y comenzó a aplicarse en los más diversos escenarios de la vida real, especialmente en el mundo de los negocios, la economía o la política.
Básicamente la teoría de juegos nos habla de cómo optimizar la toma de decisiones no sólo en base a nuestras opciones, sino teniendo muy presente las posibles decisiones del contrario, cuantificando las distintas posibilidades. ¿Cómo decidir hasta dónde podemos arriesgar para ganar? o ¿Cuánto me interesa cooperar con mi oponente? o ¿Hasta qué punto puedo forzar la tensión en la confrontación?
Fue en el año 1951 que John Forbes Nash presentó su trabajo de doctorado en el que desarrollaba con mucha más profundidad esta teoría llegando a definir lo que se conoce en la actualidad como el “equilibrio de Nash” y por el que ganó el premio Nobel de Economía en 1994. Muchos recordaréis a John Forbes Nash por la magnífica película biográfica “Una Mente Maravillosa” protagonizada por Russell Crowe; en ella se desarrolla una escena entre los minutos 18 y 21, que particularmente es una de mis preferidas, y en la que Nash rebate la teoría de economista y filósofo escocés Adam Smith. Éste defendía que “para obtener el mejor resultado cada miembro del grupo debería hacer lo mejor para él”. Nash aporta un elemento de cooperación al añadir: “que para obtener el mejor resultado cada miembro del grupo debería hacer lo mejor para él mismo y para el grupo”.
El “Dilema del Prisionero”, el “Juego del Gallina” o el “Dilema de Monty Hall” son algunos de los juegos más famosos en relación a la teoría de juegos, y que se han aplicado en algunos casos a escenarios militares o incluso en situaciones comerciales de guerra de precios. En la actualidad las llamadas “redes antagónicas” o GANs no son más que una derivada de la teoría de juegos de suma cero o minimax.
Uno de los campos de estudio más interesantes en la actualidad es la relación de la teoría de juegos con las interacciones entre humanos y robots. Investigadores de la Universidad de Sussex, Imperial College London y Nanyang Technological University en Singapur, con el Dr. Yanan Li a la cabeza, publicaron en 2019 un paper titulado “Differential Game Theory for Versatile Physical Human-Robot Interaction” (Nature Machine Intelligence). Desde hace años los seres humanos trabajamos en contacto con robots, pero este contacto presenta una serie de limitaciones, derivadas en su mayor parte de la falta de versatilidad de estos robots, es decir, la capacidad de adaptarse con facilidad y rapidez a diferentes estímulos, situaciones o escenarios propios de la interacción con humanos. Dicho de otra forma, para un robot es difícil comprender el comportamiento de su compañero humano, de forma que pueda anticiparse a sus movimientos e intenciones y actuar en respuesta a ese estímulo, haciéndolo además de forma segura.
Los autores del estudio dicen, hablando de lo que denominan “teoría de juegos diferencial”:
puede inducir a una interacción estable entre los dos interlocutores; identificar con precisión la ley de control del otro; y permitirles realizar con éxito la tarea con el mínimo esfuerzo, lo que lleva a diferentes estrategias de interacción representativas Differential Game Theory for Versatile Physical Human-Robot Interaction. Dr. Yanan Li
Otro de los autores del estudio, el Profesor Etienne Burdet, del departamento de Bioingeniería en el Imperial College London explica:
Para aplicar la teoría de juegos a la interacción humanos-robots es necesario entender cómo el robot puede identificar los objetivos de control del usuario humano al mismo tiempo que interactúa con él sin problemas Profesor Etienne Burdet, del departamento de Bioingeniería en el Imperial College London
Supongamos que establecemos la relación humano-robot como una relación recíproca entre “individuos” que necesitan alcanzar un objetivo y que por lo tanto adaptan su estrategia o comportamiento teniendo en cuenta lo mejor para él mismo y para el otro individuo. En relación a esto, Oskar Morgenstern, en “Theory of Games and Economic Behavior” dice:
Cuando varios individuos establecen relaciones recíprocas, el punto de partida del acto de comportamiento de uno cualquiera de ellos, depende de variables que éste domina sólo parcialmente. Las demás variables dependen del comportamiento de los otros individuos. Pero, el resultado total depende de todas las variables juntas Oskar Morgenstern en “Theory of Games and Economic Behavior”
Ya en 2015 el Dr. Yanan Li había publicado otro trabajo titulado “Continuous Role Adaptation for Human–Robot Shared Control” en el que propone “un método de adaptación de roles para el control compartido humano-robot. Se emplea la teoría de juegos para el análisis fundamental de este sistema con dos agentes. Se desarrolla una ley de adaptación de forma que el robot pueda ajustar su propio papel o rol en función de si el humano tiene la intención de liderar o no, lo que se infiere midiendo la fuerza de interacción. En ausencia de fuerzas de interacción humanas, el esquema adaptativo permite al robot tomar la iniciativa y completar la tarea por sí mismo. Por otro lado, cuando el humano ejerce persistentemente fuerzas que señalan una intención inequívoca de liderar, el robot cede y se convierte en el seguidor. El análisis teórico muestra que el control compartido resultante es óptimo con respecto a un juego de coordinación de dos agentes. Los resultados experimentales ilustran un mejor rendimiento general, tanto en términos de error como de esfuerzo, en comparación con las interacciones de rol fijo”.