Juego estocástico

De testwiki
Ir a la navegación Ir a la búsqueda

En la teoría de juegos, un juego estocástico, introducido por Lloyd Shapley a principios de 1950, es un juego dinámico con transiciones probabilísticas jugado por uno o más jugadores. El juego se desarrolla en una secuencia de etapas. Al comienzo de cada etapa del juego se está en algún estado. Los jugadores eligen acciones y cada jugador recibe un pago que depende del estado actual y las acciones elegidas. El juego se mueve a un nuevo estado aleatoriamente cuya distribución depende del estado previo y las acciones elegidas por los jugadores. El procedimiento se repite en el nuevo estado y el juego continúa por un número finito o infinito de etapas. El pago total a un jugador se toma a menudo como la suma descontada de los pagos etapa por etapa o el límite inferior de los promedios de las rentabilidades de cada etapa.

Los juegos estocásticos generalizan tanto los procesos de decisión de Markov y los juegos repetidos.

Teoría

Los ingredientes de un juego estocástico son: un conjunto finito de jugadores I; Un espacio de estados M, (Ya sea un conjunto finito o un espacio medible (M,𝒜), un conjunto de jugadores iI, Un conjunto de acciones Si (Ya sea un conjunto finito o un espacio medible (Si,𝒮i)); una transición de probabilidad M×S, donde S=×iISi son los perfiles de acción a M, donde P(Am,s) es la probabilidad de que el siguiente estado este en A, dado el estado actual es m y el perfil de acción actual es s.

El juego comienza en un estado inicial m1. En la etapa t, Los jugadores primero observan mt, a continuación, elija simultáneamente acciones stiSi, posteriormente observe el perfil de acción st=(sti)i , en donde la naturaleza selecciona mt+1 de acuerdo a la probabilidad P(mt,st). Una jugada del partido estocástico, m1,s1,,mt,st,, Define una corriente de pagos g1,g2,, en donde gt=g(mt,st).

Lecturas adicionales

Plantilla:Control de autoridades