Deformación dinámica del tiempo

De testwiki
Ir a la navegación Ir a la búsqueda
Dos repeticiones de una secuencia de marcha grabada con un sistema de captura de movimiento. Aunque hay diferencias en la velocidad de la marcha entre las repeticiones, las trayectorias espaciales de las extremidades siguen siendo muy similares.[1]

En análisis de series temporales, la deformación dinámica del tiempo (en inglés, Dynamic Time Warping, DTW) es un algoritmo para medir la similitud entre dos secuencias temporales que permite obtener un buen ajuste incluso frente a un desfase en la velocidad o en el tiempo. Se trata de un algoritmo de aprendizaje no supervisado, puesto que no necesita ayuda externa para realizar inferencias sobre los datos, aunque puede combinarse con otros métodos para realizar aprendizaje supervisado.[2] Aunque el nombre implica series temporales, puede usarse para todo tipo de datos, como reconocimiento facial,[3] firmas biométricas[4] e incluso clasificación de señales genómicas.[5] Conceptualmente, es similar al algoritmo Needleman-Wunsch, en tanto a que ambos realizan una matriz de disimilitud, con las distancias entre todos los miembros de una relación, como manera de calcular la distancia óptima entre los miembros de un grupo.[6]

Funcionamiento

Sobre una tabla que compara la distancia entre dos series de datos, unas flechas van iluminando el camino óptimo a seguir
Matriz de DTW y camino óptimo generado algorítmicamente

A diferencia del método euclídeo, que se basa en la comparación directa de cada punto de una serie con su equivalente en otra serie diferente, el DTW busca el "punto más cercano" entre cada punto de las dos series, permitiendo así discernir formas similares que pueden estar deformadas o desfasadas. Para ello, se genera una matriz de similitud, que compara las dos series y calcula las distancias entre todos los puntos de una y todos los puntos de la otra; y, sobre esa matriz, se selecciona el "camino más óptimo", es decir, la distancia más corta entre cada par de puntos. Para ello, sigue una serie de reglas:[7]

  • Cada elemento de la primera secuencia debe coincidir con uno o más elementos de la otra secuencia, y viceversa.
  • El primer elemento de la primera secuencia debe coincidir, al menos, con el primer elemento de la otra secuencia (pero no tiene que ser la única coincidencia)
  • El último elemento de la primera secuencia debe coincidir, al menos, con el último elemento de la otra secuencia (pero no tiene que ser la única coincidencia)
  • El mapeo de los elementos de la primera secuencia a los elementos de la otra secuencia debe ser monotónicamente creciente, y viceversa, es decir si j>i son elementos de la primera secuencia, entonces no debe haber dos elementos l>k en la otra secuencia, tales que el elemento i coincida con el elemento l y el elemento j coincida con el elemento k, y viceversa.

El camino óptimo será, entonces, la ruta que satisfaga todas estas restricciones minimizando el coste, siendo este la suma de las diferencias absolutas entre los valores de cada par de elementos coincidentes, lo que puede llevar a la deformación no lineal de las secuencias respecto al tiempo, de manera que estas nuevas secuencias "deformadas" sí que estarían euclidianamente alineadas.[8]

A diferencia de otros algoritmos, el DTW no genera nuevos elementos, sino que se limita a asociar los elementos existentes entre sí. Esto hace que el DTW sea menos sensible, al verse limitado por el número y la separación de los elementos discretos que forman cada serie temporal.

Aplicaciones

  • Reconocimiento automático del habla: Debido a los diferentes ritmos de habla, existen fluctuaciones no lineales en el patrón de habla frente al tiempo, que debe ser eliminadas.[9] Usando DTW, podemos capturar estas distancias, medirlas y cuantificar la similitud entre una muestra de audio y una señal maestra, lo que nos permite saber si se trata de la misma palabra o no.[10] También se puede usar para comparar la distancia entre la dicción de dos hablantes, lo que permite saber si se trata de la misma persona, lo que sirve de firma digital biométrica.[11]
  • Clasificación de señales genómicas: Representando cadenas de ADN mediante símbolos, podemos comparar la posición y alineación de señales genómicas determinadas mediante agrupamiento.[5]
  • Reconocimiento del paso: Si consideramos la situación del cuerpo con respecto al tiempo, obtenemos una serie temporal que puede ser procesada usando DTW para reconocer al sujeto.[4]

Implementaciones de Código abierto

  • La biblioteca de C++ lbimproved , bajo la GNU GPL, proporciona una implementación en C++ del DTW.
  • La librería FastDTW es una implementación en Java de DTW y una implementación de FastDTW que proporciona alineaciones óptimas o casi óptimas con una complejidad de tiempo y memoria O(N), en contraste con el requisito O(N2) del algoritmo DTW estándar.
  • Plantilla:Enlace roto (Java) publicado en Maven Central.
  • time-series-classification (Java) un paquete para la clasificación de series temporales usando DTW en Weka.
  • DTW suite proporciona paquetes de Python (dtw-python) y R (dtw) con una amplia cobertura de los miembros de la familia de algoritmos DTW, incluyendo una variedad de reglas de recursión (también llamadas patrones de paso), restricciones y coincidencia de subcadenas.
  • Las bibliotecas mlpy y pydtw de python implementan DTW.
  • La biblioteca cudadtw de C++/CUDA implementa la alineación de subsecuencias DTW de forma similar a la serie UCR de CUDA.
  • La biblioteca de aprendizaje automático JavaML implementa DTW.
  • La biblioteca C# ndtw implementa DTW con varias opciones.
  • Sketch-a-Char utiliza Greedy DTW (implementado en JavaScript) como parte de LaTeX.
  • MatchBox implementa DTW para emparejar señales de audio.
  • Sequence averaging: una implementación Java GPL de DBA.
  • El Gesture Recognition Toolkit|GRT, un kit de herramientas de reconocimiento de gestos en tiempo real de C++, implementa DTW.
  • El paquete PyHubs implementa DTW y los clasificadores de vecino más cercano, así como sus extensiones.
  • La biblioteca de Python simpledtw implementa el clásico algoritmo DTW y se basa en Numpy. Está licenciado bajo la licencia MIT.
  • La biblioteca de Python tslearn implementa DTW en el contexto de "series temporales".
  • La librería cuTWED de Python implementa una versión mejorada de DTW, el Time Warp Edit Distance, lo que permite mejorar la eficiencia.
  • DynamicAxisWarping.jl Es una implementación en Julia de DTW y algoritmos relacionados como FastDTW, SoftDTW, GeneralDTW y DTW barycenters.
  • dtwParallel es un paquete (en Python) que incorpora las funcionalidades principales de bibliotecas DTW actuales y añade nuevas funcionalidades como paralelización, computación de valores de similitud (basado en kernels), y la consideración de datos de diferentes tipos (categóricos, valores reales, etc.).[12]

Referencias

Plantilla:Listaref

Plantilla:Traducido ref

Bibliografía

Plantilla:Control de autoridades