Lema de Johnson-Lindenstrauss

En matemáticas, el lema de Johnson-Lindenstrauss es un resultado que lleva el nombre de William B. Johnson y Joram Lindenstrauss sobre encajes de puntos de baja distorsión, desde el espacio euclídeo de alta dimensión al espacio euclídeo de baja dimensión. El lema establece que un conjunto de puntos en un espacio de dimensión alta se puede incrustar en un espacio de dimensión mucho más baja de tal manera que las distancias entre los puntos casi se conservan. El mapa utilizado para el encaje es al menos lipschitziano, e incluso puede tomarse como una proyección ortogonal.

El lema tiene aplicaciones en detección comprimida, aprendizaje de variedades, reducción de dimensionalidad y embebido de grafos. Gran parte de los datos almacenados y manipulados en las computadoras, incluyendo texto e imágenes, se pueden representar como puntos en un espacio de alta dimensión (consúltese el artículo modelo de espacio vectorial para el caso del texto). Sin embargo, los algoritmos esenciales para trabajar con dichos datos tienden a funcionar cada vez con mayor lentitud a medida que aumenta la dimensión. Por lo tanto, es deseable reducir la dimensionalidad de los datos de una manera que conserve su estructura relevante. El lema de Johnson-Lindenstrauss es un resultado clásico en este sentido.

Además, el lema es estrecho módulo un factor constante, es decir que existe un conjunto de puntos de tamaño m que necesita dimensión

Ω (\frac{\log (m)}{ε^{2}})

para que se puedan preservar las distancias entre todos los pares de puntos dentro de un factor de $(1 \pm ε)$ .^[1]^[2]

Lema

Dado $0 < ε < 1$ , un conjunto $X$ de $m \in ℤ_{\geq 1}$ puntos en $ℝ^{N}$ ( $N \in ℤ_{\geq 0}$ ), y un número entero $n > 8 (\ln m) / ε^{2}$ , existe un mapa lineal $f : ℝ^{N} \to ℝ^{n}$ tal que

(1 - ε) ‖ u - v ‖^{2} \leq ‖ f (u) - f (v) ‖^{2} \leq (1 + ε) ‖ u - v ‖^{2}

para todos $u, v \in X$ .

La fórmula se puede reorganizar como sigue: $(1 + ε)^{- 1} ‖ f (u) - f (v) ‖^{2} \leq ‖ u - v ‖^{2} \leq (1 - ε)^{- 1} ‖ f (u) - f (v) ‖^{2}$ Alternativamente, para cualquier $ϵ \in (0, 1)$ y cualquier entero $n \geq 15 (\ln m) / ε^{2}$ ^{[Nota 1]} existe una función lineal $f : ℝ^{N} \to ℝ^{n}$ tal que la restricción $f |_{X}$ es $(1 + ε)$ - bi-lipschitziana.^{[Nota 2]}

Una prueba del lema toma ƒ como un múltiplo adecuado de la proyección ortogonal sobre un subespacio aleatorio de dimensión $n$ en $ℝ^{N}$ , y explota el fenómeno de la concentración de la medida.

En general, una proyección ortogonal reducirá la distancia promedio entre los puntos, pero se puede considerar que el lema trata con distancias relativas, que no cambian con la escala. En pocas palabras, tiras los dados y obtienes una proyección aleatoria, que reducirá la distancia promedio, y luego aumentas las distancias para que la distancia promedio vuelva a su valor anterior. Si continúa tirando los dados, encontrará, en tiempo aleatorio polinomial, una proyección para la cual las distancias (escaladas) satisfacen el lema.

Declaración alternativa del lema

Un lema relacionado es el lema distribucional JL. Este lema establece que para cualquier $0 < ε, δ < 1 / 2$ y entero positivo $d$ , existe una distribución probabilística sobre el espacio $ℝ^{k \times d}$ de donde la matriz $A$ se toma tal que para $k = O (ε^{- 2} \log (1 / δ))$ y para cualquier vector de longitud unitaria $x \in ℝ^{d}$ , se mantiene la siguiente afirmación.^[3]

P (| ‖ A x ‖_{2}^{2} - 1 | > ε) < δ

Se puede obtener el lema JL de la versión distribucional definiendo $x = (u - v) / ‖ u - v ‖_{2}$ y $δ < 1 / n^{2}$ para algún par $u, v$ ambos en $X$ . Entonces el lema JL sigue por una cuota de unión sobre todos esos pares.

Aceleramiento de la transformación JL

Dado A, calcular el producto vectorial de la matriz toma tiempo $O (k d)$ . Ha habido investigación en la derivación de distribuciones para las cuales el producto vectorial de matrices se puede calcular en tiempo menor que $O (k d)$ .

Hay dos grandes líneas de trabajo. La primera, Fast Johnson Lindenstrauss Transform (FJLT),^[4] fue presentada por Ailon y Chazelle en 2006. Este método permite calcular el producto matriz-vector en tan solo $d \log d + k^{2 + γ}$ para cualquier constante $γ > 0$ .

Otro enfoque es construir una distribución compatible con matrices que son dispersas.^[5] Este método permite mantener sólo un fracción $ε$ de las entradas en la matriz, lo que significa que el cálculo se puede hacer en tiempo tan solo $k d ε$ . Además, si el vector tiene sólo $b$ entradas distintas de cero, el Lema JL disperso toma tiempo $k b ε$ , que puede ser mucho menor que el tiempo utilizado por el Lema JL rápido, que es $d \log d$ .

Proyecciones aleatorias tensorizadas

Es posible combinar dos matrices JL tomando el llamado producto de división de caras, que se define como los productos tensoriales de las filas (propuesto por V. Slyusar^[6] en 1996^[7]^[8]^[9]^[10]^[11] para aplicaciones de conjuntos de antenas digitales y de radares ). Más concretamente, sean $C \in ℝ^{3 \times 3}$ y $D \in ℝ^{3 \times 3}$ dos matrices. Entonces el producto de división de cara $C ∙ D$ es dado por^[7]^[8]^[9]^[10]^[11]

C ∙ D = [\begin{matrix} C_{1} \otimes D_{1} \\ C_{2} \otimes D_{2} \\ C_{3} \otimes D_{3} \end{matrix}] .

La idea de tensorización fue utilizada por Kasiviswanathan et al. 2010^[12] para la rama de privacidad diferencial.

Las matrices JL definidas así usan menos bits aleatorios y se pueden aplicar rápidamente a vectores que tienen estructura tensorial, debido a la siguiente identidad:^[9]

(𝐂 ∙ 𝐃) (x \otimes y) = 𝐂 x \circ 𝐃 y = [\begin{matrix} (𝐂 x)_{1} (𝐃 y)_{1} \\ (𝐂 x)_{2} (𝐃 y)_{2} \\ ⋮ \end{matrix}]

,

dónde $\circ$ es el producto entrada por entrada (Hadamard). Dichos cálculos se han utilizado para calcular de manera eficiente los núcleos polinómicos y muchos otros algoritmos de álgebra lineal.^[13]

En 2020^[14] se demostró que si las matrices $C_{1}, C_{2}, \dots, C_{c}$ son matrices independientes con entradas $\pm 1$ o Gaussianas, la matriz combinada $C_{1} ∙ \dots ∙ C_{c}$ satisface el lema distribucional JL si el número de filas es al menos

O (ϵ^{- 2} \log 1 / δ + ϵ^{- 1} (\frac{1}{c} \log 1 / δ)^{c})

.

Para valores grandes de $ϵ$ esto es tan bueno como el Lema Johnson-Lindenstrauss completamente aleatorio, pero un límite inferior coincidente en el mismo documento muestra que esta dependencia exponencial de $(\log 1 / δ)^{c}$ es necesaria. Se sugieren construcciones JL alternativas para evitar esta circunstancia.

Véase también

Notas

Plantilla:Listaref

Referencias

Plantilla:Listaref

Lecturas adicionales

Plantilla:Obra citada. Journal version of a paper previously appearing at PODC 2001.
Plantilla:Obra citada.
Plantilla:Obra citada.
Plantilla:Cita publicación
Plantilla:Cita publicación
Plantilla:Cita publicación

Plantilla:Control de autoridades

↑ Plantilla:Cita conferencia
↑ Plantilla:Cita libro
↑ Plantilla:Cita enciclopedia
↑ Plantilla:Cita enciclopedia
↑ Plantilla:Cita publicación. A preliminary version of this paper was published in the Proceedings of the Twenty-Third Annual ACM-SIAM Symposium on Discrete Algorithms, 2012.
↑ Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics - Theory and Methods, 38:19, P. 3501
↑ ^7,0 ^7,1 Plantilla:Cita publicación
↑ ^8,0 ^8,1 Plantilla:Cita publicación
↑ ^9,0 ^9,1 ^9,2 Plantilla:Cita publicación
↑ ^10,0 ^10,1 Plantilla:Cita publicación
↑ ^11,0 ^11,1 Plantilla:Cita publicación
↑ Kasiviswanathan, Shiva Prasad, et al. "The price of privately releasing contingency tables and the spectra of random matrices with correlated rows." Proceedings of the forty-second ACM symposium on Theory of computing. 2010.
↑ Woodruff, David P. "Sketching as a Tool for Numerical Linear Algebra." Theoretical Computer Science 10.1-2 (2014): 1-157.
↑ Plantilla:Cita conferencia

Error en la cita: Existen etiquetas <ref> para un grupo llamado «Nota», pero no se encontró la etiqueta <references group="Nota"/> correspondiente.

[1] Plantilla:Cita conferencia

[2] Plantilla:Cita libro

[5] Plantilla:Cita enciclopedia

[6] Plantilla:Cita enciclopedia

[7] Plantilla:Cita publicación. A preliminary version of this paper was published in the Proceedings of the Twenty-Third Annual ACM-SIAM Symposium on Discrete Algorithms, 2012.

[Fortiana-8] Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics - Theory and Methods, 38:19, P. 3501

[slyusar-9] 7,0 ^7,1 Plantilla:Cita publicación

[slyusar1-10] 8,0 ^8,1 Plantilla:Cita publicación

[DIPED-11] 9,0 ^9,1 ^9,2 Plantilla:Cita publicación

[slyusar2-12] 10,0 ^10,1 Plantilla:Cita publicación

[general-13] 11,0 ^11,1 Plantilla:Cita publicación

[14] Kasiviswanathan, Shiva Prasad, et al. "The price of privately releasing contingency tables and the spectra of random matrices with correlated rows." Proceedings of the forty-second ACM symposium on Theory of computing. 2010.

[woodruff-15] Woodruff, David P. "Sketching as a Tool for Numerical Linear Algebra." Theoretical Computer Science 10.1-2 (2014): 1-157.

[highdeg-16] Plantilla:Cita conferencia

[1]

[2]

[Nota 1]

[Nota 2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Lema de Johnson-Lindenstrauss

Sumario

Lema

Declaración alternativa del lema

Aceleramiento de la transformación JL

Proyecciones aleatorias tensorizadas

Véase también

Notas

Referencias

Lecturas adicionales

Menú de navegación

Lema de Johnson-Lindenstrauss

Lema

Declaración alternativa del lema

Aceleramiento de la transformación JL

Proyecciones aleatorias tensorizadas

Véase también

Notas

Referencias

Lecturas adicionales

Menú de navegación

Buscar