Emparejamiento óptimo

De testwiki
Ir a la navegación Ir a la búsqueda

Plantilla:Complejo Plantilla:Mal traducido El emparejamiento óptimo es un método de análisis secuencial utilizado en ciencias sociales, para evaluar la similitud de arreglos ordenados de símbolos que normalmente representan una secuencia temporal ordenada de los estados socioeconómicos que dos individuos han experimentado. Una vez que tales distancias han sido calculadas para un conjunto de observaciones (por ejemplo, individuos de una cohorte) herramientas clásicas (tales como el Algoritmo de agrupamiento) pueden ser utilizados. El método fue adaptado a las ciencias sociales[1] a partir de una técnica introducida originalmente para estudiar la biología molecular. El emparejamiento óptimo utiliza el Algoritmo Needleman-Wunsch.

Algoritmo

Sea S=(s1,s2,s3,sT) una secuencia de estados si que pertenecen a un conjunto finito de estados posibles. Denotemos 𝐒 el espacio de secuencias, es decir, el conjunto de todas las posibles secuencias de estados. Los algoritmos de correspondencia óptimos funcionan mediante la definición de operador simples álgebras que manipulan secuencias, es decir, un conjunto de operadores ai:𝐒𝐒. En el enfoque más simple, se utiliza un conjunto compuesto de solamente tres operaciones básicas para transformar secuencias:

  • un estado s se inserta en la secuencia asIns(s1,s2,s3,sT)=(s1,s2,s3,,s,sT)
  • un estado es borrado de la secuencia as2Del(s1,s2,s3,sT)=(s1,s3,sT) y
  • un estado s1 es reemplazado (substituted) por un estado s'1, as1,s'1Sub(s1,s2,s3,sT)=(s'1,s2,s3,sT).

Imagínese ahora que un coste c(ai)𝐑0+ se asocia a cada operador. Dadas dos secuencias S1 and S2, La idea es medir el costo de obtener S2 de S1 utilizando los operadores del álgebra. Dejar A=a1,a2,an ser una secuencia de operadores de manera que la aplicación de todos los operadores de esta secuencia La a la primera secuencia S1 da la segunda secuencia S_2 : S2=a1a2an(S1) donde a1a2 denota el operador compuesto. A este conjunto asociamos el costo c (A) = \ sum_ {i = 1} ^ n c (a_i) , Que representa el costo total de la transformación. Hay que tener en cuenta en este punto que podría existir diferentes tales secuencias La que transforman S1 en S2; Una elección razonable es para seleccionar el más barato de tales secuencias. Por la presente instamos a distancia
 :d(S1,S2)=minA{c(A)suchthatS2=A(S1)}

es decir, el coste del conjunto menos costosa de las transformaciones que se convierten S1 en S2. Tenga en cuenta que d(S1,S2) es por definición no negativo, ya que es la suma de los costes de positivos, y trivialmente d(S1,S2)=0 si y sólo si S1=S2, Es decir, no hay ningún costo. La función de distancia es simétrica si los costos de inserción y supresión son iguales c(aIns)=c(aDel), El término costo indel lo general se refiere a los gastos comunes de inserción y supresión.

Teniendo en cuenta un conjunto compuesto de sólo las tres operaciones básicas descritas anteriormente, esta medida proximidad satisface la desigualdad triangular. transitividad sin embargo, depende de la definición del conjunto de las operaciones elementales.

Crítica

Aunque las técnicas de juego óptimas son ampliamente utilizadas en sociología y la demografía, estas técnicas también tienen sus defectos. Como se ha señalado por varios autores (por ejemplo L. L. Wu[2]), el principal problema en la aplicación de emparejamiento óptimo es definir adecuadamente los costos c(ai).

Emparejamiento óptimo en el modelado causal

El emparejamiento óptimo es también un término usado en el modelado estadístico de efectos causales. En este contexto se refiere a la combinación "casos" con "controles", y es completamente independiente del sentido de la secuencia analítica.

Referencias

Plantilla:Listaref

Plantilla:Control de autoridades