En los próximos años vamos a trabajar en el estudio, el desarrollo teórico, la implementación y la validación empírica de conceptos formales y criterios para su empleo en la construcción de modelos descriptivos y predictivos de secuencias simbólicas. En concreto estudiaremos los siguientes tipos de modelos: mecanismos de compresión (compresores de estados finitos y algoritmos de Lempel-Ziv), generalizaciones de grafos (extensiones probabilistas y cuánticas, árboles de decisión, integración de árboles de decisión con modelos ocultos de Markov, 2-estructuras y T-estructuras), modelos gramaticales (gramáticas categoriales, modelos suavemente sensibles al contexto), series temporales, estudio de subsecuencias (búsqueda de episodios, conjuntos frecuentes y reglas de asociación; descubrimiento de patrones de conducta). La validación empírica de los modelos se realizará utilizando grandes volúmenes de datos reales: alumnos de universidades, datos oncológicos del Hospital Clínico Universitario, secuencias de datos biológicos, datos climáticos.