Hace unas cuantas semanas, Julio Alberto García, uno de los investigadores de turisLAB presentó su proyecto de fin de carrera en la Escuela Politécnica de la Universidad de las Islas Baleares. El proyecto se titulaba “Optimización del sistema de matrícula turística” y fue co-dirigido por Carlos Juiz y por mi.
Hace tiempo que hablamos en este blog de matrícula turística, y de unos y otros avances que hemos ido llevando a cabo dentro del proyecto. La matrícula empezó con la idea de disponer de un registro global de recursos turísticos donde cada uno de ellos tuviese un identificador único.
En primera instancia, decidimos limitar el conjunto de recursos turísticos a hoteles, moteles, apartamentos… alojamiento en general. El primer problema que tuvimos con el registro global, fue el elevado numero de instancias duplicadas que había dentro del registro y peor aún… que la única manera de localizar estos duplicados era manual.
Gracias al trabajo de este proyecto, tuvimos la ocasión de investigar algoritmos de “matching” que nos permitirían encontrar estos duplicados de manera automática, si bien no todos, si la mayor parte de ellos. A continuación, se muestra un esquema que representa el funcionamiento de la matrícula tras la inclusión de los algoritmos que a Julio le sirvieron como proyecto de fin de carrera.
El producto final del proyecto de matrícula turística es el listado de códigos mantenido con toda esta aplicación que se encuentra en la página de especificaciones del proyecto CAVAL.
turisLAB ha sido pionero en desarrollar la idea de la identificación única de recursos turísticos, ahora empiezan a aparecer empresas que trabajan en proyectos similares. Pero es precisamente nuestra experiencia, la que nos ha demostrado que es difícil que las empresas dediquen esfuerzos en llevar a cabo “una integración más“, lo que realmente necesitan las empresas son sistemas que les permitan ahorrar costes en su trabajo diario.
Por esta razón, nuestro trabajo en identificación única de recursos, y algoritmos de detección de duplicados está evolucionando a poder ofrecer a las empresas herramientas de matching con las que tarden menos tiempo en fusionar tablas de códigos de recursos turísticos.
Actualmente, estamos trabajando en una aplicación de escritorio que va a permitir encontrar hoteles iguales en dos registros diferentes. Aprovecharemos toda la experiencia obtenida con los algoritmos de matching, y el uso de la web semántica nos dará el potencial que nos puedan dar las inferencias o la transitividad. Una herramienta de este estilo acortará el tiempo que dedican las empresas a realizar mapeos entre tablas de códigos cuando hacen una integración la una con la otra, detectando gran parte de las equivalencias.