798
El pasado 8 de abril Octavio Jaume, miembro del’equipo de Wireless DNA, impartió un taller de visualización de datos en el espacio Emprenbit.
Aquí tenéis un resumen de lo más destacado:
- Octavio explica el trabajo que hacen con datos para hacer predicciones en Wireless DNA. Presentamos las 3 Vs del Big Data: volumen, velocidad y variedad, pero también con los problemas que conllevan.
- Tratamiento de datos: ver la parte gratuita y la de pago cuál nos conviene más: a quien orientado, basta la gratuita, compensa económicamente?
- Tipos de archivos (csv o texto plano / otros formatos); bases de datos (relacionales / no relacionales). Más fáciles los no relacionales. Entornos: sólo interfaz, interfaz mixta, sin interfaz. Pros y contras.
- Entornos sin interfaz, lenguajes: R sobretodo funciona muy bien, pero también Phyton (con NumPy), y Julia (reciente).
- El lenguaje R permite optimización para el cálculo, muchas librerías, facilidad para tratar datos, aunque también tiene algunas desventajas.
- Optimizar funciones es muy importante. Por ejemplo, un proyecto de índices de confort de excursiones que hicimos Wireless DNA con la UIB.
- Optimización de la memoria: hay que preguntarse si hay que tratar todos los datos en ese momento, si son independientes, si se necesitan tantos dígitos /longitud para la unidad de datos …
- ¿Por qué es importante filtrar los datos? No existe la herramienta definitiva para visualización de datos, todas tienen ventajas y desventajas hay que apoyarse en todas: tablas, mapas, gráficas …
- Ventajas / desvantages de las gráficas, ver por ejemplo From data to Viz. Hay herramientas de Javascript gratis y de pago.
- Ventajas / desventajas de los mapas. Leaflet es gratis y está muy bien.
- 3 maneras de mostrar datos georreferenciados. Los markers (iconos), se pueden agrupar; sólo mostrar uno a un cierto radio; mapas de calor.
Para más información, aquí podéis consultar la presentación completa.