Desde turisLAB hemos tenido la oportunidad de introducirnos en la línea de la minería de datos (concretamente en predicciones basadas en series temporales), a raíz del proyecto Beauty.
El objetivo de turisLAB dentro del proyecto ha sido el de elaborar un modelo matemático para realizar predicciones sobre la demanda del sector hotelero. Hasta ahora hemos implementado y obtenido resultados exitosos los modelos de Redes Neuronales Artificiales y ARIMA, estos modelos y muchos otros pueden ser representados en XML mediante el estándar PMML (Predictive Models Markup Language) elaborado por el Data Mining Group. Este lenguaje, permite que un hotelero pueda integrar los modelos de predicción en su herramienta de Business Intelligence.
Aprovechamos este post para presentar un nuevo site con los resultados del trabajo desarrollado por turisLAB en el proyecto, presentando un sistema automático para realizar predicciones utilizando redes neuronales artificiales sobre series temporales. Dichos modelos pueden ser utilizados por cualquier usuario.
El sistema funciona introduciendo una serie temporal como dato de entrada, en ese momento se le ofrecen al usuario diferentes opciones: configurar una red neuronal artificial a medida, permitir que el sistema busque la red más adecuada o de cargar un fichero PMML con una red predefinida. Una vez que el sistema tiene los datos y el modelo predictivo empieza a trabajar probando cientos de redes neuronales artificiales de manera inteligente para ver cual es la que mejor se adapta al problema planteado por el usuario. La idea es que el sistema compara los errores producidos por el uso de diferentes redes neuronales artificiales a fin de encontrar mínimos locales y comparalos. Finalmente, la red que haya ofrecido el mínimo error de predicción será la que se utilizará para predecir el comportamiento de la serie temporal.
Nuestra idea es la de seguir trabajando en esta línea actualizándo el portal con los nuevos modelos que vayamos implementando en otros proyectos y no limitarnos únicamente a la predicción basada en series temporales, sobre la que aún nos queda mucho que hacer… sino también trabajar en otros temas como contemplar los factores causales (se basan en como afectan los elementos del entorno a una variable) o problemas de optimización.