Centralidad de cercanía

De testwiki
Ir a la navegación Ir a la búsqueda
Ejemplo de un mismo grafo donde se visualizan distintas medidas de centralidad:
A) intermediación
B) cercanía
C) vector propio
D) grado
E) centralidad armónica
F) centralidad de Katz
Las tonalidades van del rojo (más centrales) al azul (más periféricos).

En análisis de redes sociales, la centralidad de cercanía, o simplemente cercanía (en inglés, closeness), es una medida de centralidad basada en las ideas de Plantilla:Harvtxt, definida formalmente por Plantilla:Harvtxt y Plantilla:Harvtxt, con aplicaciones en redes de comunicación,[1] y luego popularizada porPlantilla:Harvtxt.[2] Es la más conocida y utilizada de las medidas radiales de longitud. Se basa en calcular la suma o bien el promedio de las distancias geodésicas (o longitudes de los caminos más cortos) desde un nodo hacia todos los demás.[3] Note que mientras mayor sea la «distancia» entre dos vértices, menor será la «cercanía» entre estos. Por lo tanto, la cercanía se define como el inverso multiplicativo de la «lejanía» entre dos vértices.[4]

Definición formal

En lo que sigue, se define formalmente un grafo como un par ordenado G=(V,E), donde V es su conjunto de nodos o vértices y E su conjunto de aristas. El número de vértices se denota como n=|V|.

Formalmente, para un grafo (dirigido o no dirigido), sea d(u,v) la distancia geodésica entre los nodos u y v, la cercanía CC(u) de un nodo uV se define como:[5]

CC(u)=1vVd(u,v)

Note que en algunas referencias d(u,v) puede cambiar por d(v,u).[6]

Sea S la matriz de distancias de la red, es decir, aquella matriz cuyos elementos (i,j) corresponden a la distancia geodésica desde el nodo i hasta el nodo j, entonces una definición alternativa es la siguiente:

CC(i)=1j=1n(S)ij

Para normalizar esta medida, se considera el mayor valor posible que podría asumir la medida para un nodo. Si el grafo no admite bucles, entonces un nodo a lo más puede conectarse directamente a los n1 nodos restantes; si admite bucles (y asumimos que no es un multigrafo), entonces podrá conectarse directamente con los n nodos de la red. Por lo tanto, la medida normalizada queda definida formalmente, para ambos casos, respectivamente:

CC(u)=n1vVd(u,v) o bien CC(u)=nvVd(u,v)

En una red de flujo esta medida se puede interpretar como el tiempo de llegada a destino de algo que fluye a través de la red.[7] También puede interpretarse como la rapidez que tomará la propagación de la información desde un nodo a todos los demás.[8] La cercanía mide de alguna forma la accesibilidad de un nodo en la red. Este concepto es utilizado también de manera similar en topología, donde se define como un espacio métrico.

Note que en un grafo disconexo, la cercanía de todos los vértices será siempre igual a 0, dado que siempre existirá algún otro nodo para el cual la distancia geodésica con él resulta infinita. Por lo tanto, la centralidad de cercanía tiene la desventaja de que solo se puede aplicar, en el caso de redes no dirigidas, sobre grafos conexos o componentes conexos, y para redes dirigidas, sobre componentes fuertemente conexos.[5]

Variantes de la cercanía

En lugar de considerar la suma de las distancias geodésicas de un nodo hacia todos los demás, existe una variante que se enfoca únicamente en hallar la menor de estas distancias geodésicas. La excentricidad de un nodo es la mayor distancia entre ese nodo y cualquier otro del grafo. El centro de Jordan refiere al subconjunto de nodos con menor excentricidad dentro del grafo. Este centro puede encontrarse fácilmente a partir de la matriz de distancias del grafo, seleccionando aquellos nodos que comparten el menor valor máximo de sus respectivas filas en la matriz.[5] Un concepto relacionado muy antiguo, al menos desdePlantilla:Harvtxt, es el de centroide, más apropiado específicamente para árboles.[9] La idea es que para cada nodo del árbol, se considera el peso de cada una de sus ramas o caminos que parten desde dicho nodo, donde el peso de una rama es su número de aristas. El nodo se queda con el mayor de los pesos resultantes de entre todas sus ramas. El centroide corresponde así al subconjunto de nodos que comparten el peso final más pequeño.[5]

La medida tradicional de cercanía asume que la propagación de información siempre se da en la red a través del camino más corto. Este modelo puede no ser el más realista para algunos tipos de escenarios de comunicación. Por ello han surgido algunas variantes de esta medida como la denominada cercanía por camino aleatorio (en inglés, random-walk closeness centrality), introducida por Plantilla:Harvtxt y que considera caminos aleatorios para acceder de un nodo a los demás, en lugar de escoger siempre el camino más corto.[10]

En grafos disconexos

Existen algunas variantes de la cercanía que permiten trabajar con grafos disconexos. Si la red no es un componente fuertemente conexo,Plantilla:Harvtxt propuso usar la suma del recíproco de las distancias en lugar del recíproco de la suma de las distancias, con la convención de que 1/=0, esto es, que las distancias entre actores inaccesibles sea cero, en lugar de infinito:

H(u)=uvn1d(u,v)

A esta medida actualmente se le conoce como centralidad armónica (harmonic centrality, en inglés).[11] Esta medida respeta el principio general propuesto por Plantilla:Harvtxt, que dice que en grafos con distancias infinitas la media armónica se comporta mejor que la media aritmética, utilizada por la medida de cercanía tradicional.[12] Esta idea es similar al factor de potencial de mercado propuesto por Plantilla:Harvtxt,[13] que actualmente se conoce como «acceso al mercado» (market access, en inglés).[14]

Esta idea ha reaparecido varias veces en la literatura, usualmente sin el factor de normalización n1, por ejemplo por Plantilla:Harvtxt para grafos no dirigidos, bajo el nombre de centralidad valorada (valued centrality, en inglés).[15] Fue axiomatizada por Plantilla:Harvtxt[16] y propuesta nuevamente por Plantilla:Harvtxt como solución para redes con componentes disconexos.[17] Sus axiomas también fueron estudiados por Plantilla:Harvtxt.[18]

Otra alternativa natural, siguiendo las ideas de Plantilla:Harvtxt, es considerar únicamente los nodos accesibles desde o hacia el nodo cuya centralidad se está midiendo.[19] Sea Ju el número de actores dentro del rango de influencia de u (o accesibles desde o hacia u, dependiendo de si se desea trabajar con aristas de salida o de llegada en un grafo dirigido, respectivamente), se puede definir la siguiente variante de la centralidad de cercanía:

CC*(u)=Ju/(n1)vVd(u,v)/Ju

donde Ju/(n1) es la proporción de nodos accesibles en el componente conexo, y vVd(u,v)/Ju es la distancia media de los nodos a v.[5]

Una alternativa más distinta es la de Plantilla:Harvtxt, quien propone la siguiente medida de vulnerabilidad en las redes:[20]

CDC(i)=j=1n2(S)ij

donde S es nuevamente la matriz de distancias.

Índices de prestigio

Para redes dirigidas, la cercanía y sus variantes se suelen centrar en caminos desde un nodo dado. Sin embargo, también puede ser útil considerar los caminos hacia dicho nodo. A las medidas de centralidad que consideran este último tipo de caminos se les suele también llamar medidas o índices de prestigio.[5]

A partir de ideas de Plantilla:Harvtxt, el prestigio de proximidad PP(u) de un nodo uV se define como:

PP(u)=Iu/(n1)vD(u)d(v,u)/Iu=Iu2(n1)vD(u)d(v,u)

donde D(u) es el dominio de influencia del nodo u, es decir, el conjunto de actores que pueden acceder a dicho actor, Iu=|D(u)| es la cardinalidad del dominio de influencia de u, Iu/(n1) es la proporción de nodos de la red que están en el dominio de influencia de u, y vD(u)d(v,u)/Ii es la distancia media a la que los nodos del dominio de influencia están de u.[5]

Note que el prestigio de proximidad se puede aplicar sobre redes disconexas.[5]Plantilla:Harvtxt y Plantilla:Harvtxt también propusieron medidas similares.[21][22]

Por otra parte,Plantilla:Harvtxt define el estatus neto de un actor uV, que definiremos PE(u), como:[23]

PE(u)=vVd(u,v)vVd(v,u)

donde la primera sumatoria es el estatus de v, y la segunda sumatoria el contraestatus de v.

Otro índice de prestigio conocido es la centralidad de vector propio, la que para cada actor considera no solo su propio prestigio, sino también el de los actores que apuntan a este. Bajo este criterio, un actor es más prestigioso en la medida que los actores relacionados con él son también más prestigiosos.[5]

Véase también

Referencias

Plantilla:Listaref

Bibliografía

Plantilla:Control de autoridades