Método de factorización de Dixon

De testwiki
Ir a la navegación Ir a la búsqueda

En teoría de números, el método de factorización de Dixon (conocido también como método de los cuadrados aleatorios de Dixon[1] o algoritmo de Dixon) es un algoritmo general de factorización de enteros; es el método prototípico de base de factores, y el único método de este tipo para el cual los límites de ejecución no se basan en conjeturas sobre las propiedades de suavidad de los valores de un polinomio conocido.

Historia del algoritmo

Las ideas de este algoritmo provienen de Maurice Kraitchik, quien en la década de 1920 generalizó un famoso método debido a Pierre de Fermat[2] (que funciona bien cuando los factores son cercanos). D. H. Lehmer y R. E. Powers sugirieron una idea parecida en un artículo publicado en 1931,[3] utilizando fracciones continuas.

John Brillhart y Michael Morrison en 1975[4] muestran cómo mejorar el algoritmo utilizando el álgebra lineal sobre F2 (el cuerpo con dos elementos). John D. Dixon muestra la eficiencia del algoritmo en un artículo publicado en 1981.[5]

El algoritmo de criba cuadrática, debido a Carl Pomerance,[6] utiliza ideas similares a las de este método.

Ideas matemáticas sobre las que se basa

Si n es primo y a≢0 (mod n), entonces la ecuación x2a2 (mod n) tiene dos soluciones distintas: a, a.

Sin embargo, si n es compuesto y no es la potencia de un primo, la ecuación x2a2 (mod n) tiene más soluciones; estas soluciones vienen de la factorización de n como producto de dos enteros coprimos entre sí. Si n=pq con p,q coprimos entonces tomando x tal que xa (mod p) y xa (mod q) (esto se puede hacer gracias al Teorema chino del resto) encontramos una solución a x2a2 (mod n) que es distinta de a y a.

Recíprocamente, si x verifica x2a2 (mod n) y x≢±a, entonces xa no es coprimo con n ni múltiplo de él.

La idea básica del algoritmo es intentar encontrar dos enteros x, a tales que x≢±a y x2a2 (mod n), con lo que mcd(xa,n) será un divisor de n no trivial. Buscar al azar estos enteros lleva mucho tiempo y no hace eficaz el método. Lo que se hace para tener más probabilidad de "colisión" es tomar enteros cuyos cuadrados tengan factores primos pequeños.

Más concretamente: tomamos una "base de factores" B={p1,,pk} formada por enteros pequeños y buscamos c1,ck+1 tales que c12p1α1,1××pkα1,k (mod n), . . . , ck+12p1αk+1,1××pkαk+1,k (mod n). Luego escogemos ci1,,cir de forma que ci12××cir2p1β1××pkβk (mod n), con cada uno de los βi par.

Dadas las k-uplas (α1,1,,α1,k), . . . , (αk+1,1,,αk+1,k), encontrar i1,,ir tales que ci1××cir (mod n) sea un producto de elementos de B al cuadrado no es otra cosa que obtener una combinación lineal de las k-uplas que sea la nula módulo 2. O sea que es un problema de álgebra lineal en F2, que puede resolverse en forma rápida.

El método

Sea n el entero compuesto que deseamos factorizar.

Tomamos H una cota, llamemos B al conjunto de los primos menores o iguales que H unión el -1.

Inicialmente, buscamos enteros z tales que z2 (mod n) se pueda escribir como producto de elementos de B.

Supongamos que hemos encontrado suficientes de estos números (suficientes en general significa poco más que el cardinal de B): z1,,zr. Utilizamos el álgebra lineal (como se describe en la sección anterior) para encontrar un producto zj12××zjt2 que módulo n es el cuadrado de un producto de elementos de B.

O sea, hemos obtenido zj12××zjt2=p12α1××ph2αh (mod n), o, escribiéndolo de otra manera: (zj1××zjt)2=(p1α1××phαh)2 (mod n). Por lo tanto, el máximo común divisor entre zj1××zjtp1α1××phαh y n será distinto de 1 y n siempre que zj1××zjt±p1α1××phαh (mod n).

En caso de que zj1××zjt=±p1α1××phαh (mod n) se busca otra combinación lineal que nos dé un producto de cuadrados de elementos de B.

Ejemplo

Sea n=50861. Tomamos H=5, por lo que B={1,2,3,5}.

Encontramos varios enteros cuyos cuadrados son factorizados (módulo n) sobre B:

1295222×3×5;

172621×3;

244921×3×5;

256723;

262421×32×5.

Tenemos las 4-uplas: (0,2,1,1), (1,0,1,0), (1,0,1,1), (0,0,1,0) y (1,0,2,1); estos son los exponentes de la factorización de los cuadrados como productos de elementos de B. Al tener 5 4-uplas, debe haber una que sea combinación de las otras (módulo 2); o lo que es lo mismo, una suma de estas 4-uplas tendrá todas sus entradas pares.

De hecho, la suma de las primeras cuatro da (2,2,4,2). Esto quiere decir que al multiplicar los primeros cuatro números, su cuadrado será (1)2×22×34×52 (módulo n). O sea que (1295×1726×2449×2567)2(2×32×5)2 (mod n).

Reducimos: 1295×1726×2449×256719639 (mod n). Esta combinación hallada no nos da ningún factor, ya que 19639(2×32×5).

Buscamos otra suma que nos dé con entradas pares: las tres últimas. Obtenemos de allí que (2449×2567×2624)2(32×5)2 (mod n), o lo que es lo mismo: 47512452 (mod n). De aquí sí sacamos un factor no trivial de n: mcd(475145,n)=181.

Tiempo de ejecución

Si en el algoritmo escogemos un H pequeño entonces es fácil saber si un entero se factoriza sobre B, pero es difícil encontrar naturales cuyo cuadrado sea producto de elementos de B. A la inversa, si H es grande será sencillo encontrar naturales cuyo cuadrado sea producto de elementos de B pero complicado saber si un entero se factoriza sobre B.

La clave para optimizar este método es escoger el valor adecuado de H. Puede probarse que si n tiene r dígitos es bueno tomar H con aproximadamente r dígitos. Esto hace que el tiempo de ejecución del algoritmo tenga un orden O(eC(log(n)log(log(n)))) para cierta constante C.[7] Dixon mostró que podía tomar C=32, pero Schnorr y Knuth lograron mejorar la prueba, asegurando que C=22.[6]

Referencias

Plantilla:Listaref

Enlaces externos

Plantilla:Control de autoridades