Modelo de Bradley–Terry

El modelo de Bradley–Terry es un modelo de probabilidad que puede predecir el resultado de una comparación pareada. Dado un par de individuos i y j extraídos de alguna población, se estima la probabilidad de que la comparación por pares i > j resulta cierta, como

P (i > j) = \frac{p_{i}}{p_{i} + p_{j}}

donde p_i es una puntuación real positiva asignada al individuo i. La comparación i > j se puede leer como "i es preferible a j", "i ocupa un lugar más alto que j" o "i vence a j", según la aplicación.

Por ejemplo, p_i puede representar la habilidad de un equipo en un torneo deportivo, estimada a partir del número de veces que he ganado un partido. $P (i > j)$ a continuación, representa la probabilidad de que i a ganar un partido contra j.^[1]^[2] Otro ejemplo utilizado para explicar el propósito del modelo es el de puntuar los productos de una determinada categoría por calidad. Si bien es difícil para una persona redactar una clasificación directa de (muchas) marcas de vino, puede ser factible comparar una muestra de pares de vinos y decir, para cada par, cuál es mejor. El modelo de Bradley–Terry se puede utilizar para obtener una clasificación completa.^[2]

Historial y aplicaciones

El modelo lleva el nombre de R. A. Bradley y M. E. Terry,^[3] quienes lo presentaron en 1952,^[4] aunque ya había sido estudiado por Zermelo en la década de 1920.^[1]^[5]^[6]

Las aplicaciones del modelo en el mundo real incluyen la estimación de la influencia de las revistas estadísticas o la clasificación de documentos por relevancia en los motores de búsqueda con aprendizaje automático.^[7] En la última aplicación, $P (i > j)$ puede reflejar que el documento i es más relevante para la consulta del usuario que el documento j, por lo que debería mostrarse antes en la lista de resultados. El p_i individual expresa entonces la relevancia del documento y se puede estimar a partir de la frecuencia con la que los usuarios hacen clic en "resultados" particulares cuando se les presenta una lista de resultados.^[8]

Definición

El modelo de Bradley–Terry se puede parametrizar de varias formas. Una forma de hacerlo es elegir un solo parámetro por observación, lo que lleva a un modelo de n parámetros p₁, ..., p_n.^[9] Otra variante, de hecho la versión considerada por Bradley y Terry,^[2] utiliza funciones de puntuación exponencial $p_{i} = e^{β_{i}}$ de modo que

P (i > j) = \frac{e^{β_{i}}}{e^{β_{i}} + e^{β_{j}}}

o, usando el logit (y no permitiendo los lazos),^[1]

logit (P (i > j)) = \log (\frac{P (i > j)}{1 - P (i > j)}) = \log (\frac{P (i > j)}{P (j > i)}) = β_{i} - β_{j}

reduciendo el modelo a regresión logística por parejas de individuos.

Estimación de los parámetros

El siguiente algoritmo calcula los parámetros p_i de la versión básica del modelo a partir de una muestra de observaciones. Formalmente, calcula una estimación de máxima verosimilitud, es decir, maximiza la probabilidad de los datos observados. El algoritmo se remonta al trabajo de Zermelo.^[1]

Las observaciones requeridas son los resultados de comparaciones previas, por ejemplo, pares (i , j) donde i vence a j. Resumiendo estos resultados como w_ij, el número de veces que i ha vencido a j, obtenemos la probabilidad logarítmica del vector de parámetros p = p₁ , ..., p_n como^[1]

L (𝐩) = \sum_{i}^{n} \sum_{j}^{n} w_{i j} \ln p_{i} - w_{i j} \ln (p_{i} + p_{j}) .

<

Denote el número de comparaciones "ganadas" por i como W_i. A partir de un vector arbitrario p, el algoritmo realiza iterativamente la actualización

p'_{i} = W_{i} {(\sum_{j \neq i} \frac{w_{i j} + w_{j i}}{p_{i} + p_{j}})}^{- 1}

para todo i. Después de calcular todos los nuevos parámetros, deben volver a normalizarse,

p_{i} \leftarrow \frac{p'_{i}}{\sum_{j = 1}^{n} p'_{j}} .

Este procedimiento de estimación mejora la probabilidad logarítmica en cada iteración y, finalmente, converge a un máximo único.

Véase también

Referencias

Plantilla:Listaref Plantilla:Control de autoridades

[hunter-1] 1,0 ^1,1 ^1,2 ^1,3 ^1,4 Plantilla:Cita publicación

[agresti-2] 2,0 ^2,1 ^2,2 Plantilla:Cite book

[3] Plantilla:Cita web

[4] Plantilla:Cita publicación

[5] Plantilla:Cita publicación

[6] Plantilla:Cita libro

[7] Plantilla:Cita publicación

[8] Plantilla:Cite conference

[wu-9] Plantilla:Cita publicación

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Modelo de Bradley–Terry

Sumario

Historial y aplicaciones

Definición

Estimación de los parámetros

Véase también

Referencias

Menú de navegación

Modelo de Bradley–Terry

Historial y aplicaciones

Definición

Estimación de los parámetros

Véase también

Referencias

Menú de navegación

Buscar