Dins del marc del nostre projecte Ten TIC (tendencies de futur en las TIC) continuam amb la nostra sèrie d’entrevistes amb experts. Aquesta setmana entrevistam a Carlos Alonso, de l’empresa Meteoclim, spin-off de la UIB, que es dedica a generar i analitzar informació meteorológica i climàticaamb les seves propies eines de predicció atmosfèrica, climàtica i hidrològics amb la tecnologia més avanzada per fer previsions meteorològiques per grans esdevidements deportius,mitjans de comunicación i estudis d’impacte del canvi climàtic.
1.- Quina relació té MeteoClim amb el Big Data?
En el dia a dia de l’empresa utilitzam grans quantitats d’informació provinent tant de les prediccions meteorològiques que generam nosaltres mateixos, com de les projeccions climàtiques globals que utilitza el IPCC per elaborar els seus informes. Aquesta informació s’ha de tractar de forma personalitzada segons l’ús final, de manera que partim de grans matrius d’ informació i es va desgranat en blocs mes petits d’ informació per la seva anàlisi i tractament. Per a fer-se una idea ràpida, només un model climàtic té informació diària per més de cent anys, i a més s’ha de tenir en compte que hi ha una gran quantitat de variables (temperatura, precipitació, etc..) i que com a mínim es treballen tres escenaris de creixement econòmic. Això només per un punt i un model, nosaltres solem treballar amb xarxes que cobreixen tot el món i com a mínim amb 10 models diferents…Per Meteoclim el Big Data és el dia a dia.
2.- Quina metodologia i tecnologia utilitzau per cercar i emmagatzemar la informació? Quina és el principal avantatge? Quina és la principal dificultat?
En general emmagatzemam la informació en fitxers NetCDF, que estan pensats per a dades científiques i son àmpliament utilitzats en climatologia, meteorologia y aplicacions de sistemes de informació geogràfica. Aquests fitxers formen part d’un repositori basat en un servidor THREDDS, una eina orientada a la connectivitat entre proveïdors científics i possibles usuaris finals.
3.- Quines fonts d’informació analitzau?
Nosaltres treballam amb les nostres pròpies prediccions, així que generam les nostres fonts, i quan és necessari utilitzar un model global de predicció meteorològica utilitzam el GFS americà. En la branca de canvi climàtic utilitzam les dades del CMIP5, que són les que utilitza el IPCC per elaborar els seus informes.
4.- Quina metodologia i tecnologia utilitzau per analitzar la informació que extreieu de les fonts abans esmentades? Quina és la principal avantatge? Quina és la principal dificultat?
El tractament de dades el fem amb el programa estadístic R, que té capacitat per a tractar amb grans quantitats de dades si va acompanyat d’un entorn informàtic de gran capacitat de càlcul. El principal avantatge és la gran versatilitat i personalització que permet.
5.- Quines són les variables que analitzau i com relacionau unes variables amb les altres?
Analitzam les variables meteorològiques i climàtiques presents en els models i en les observacions. Per exemple, temperatura, precipitació, cobertura nuvolosa, vent, etc. La relació entre elles ve marcada per la física, per exemple, una zona de baixa pressió atmosfèrica sol estar associada amb vents forts i elevació, que pot produir núvols.
6.- Quina tecnologia utilitzau per a realitzar els mapes i els gràfics que oferiu als vostres clients?
Per a realitzar els mapes i gràfics utilitzam una mescla d’scripts d’R per a prepararar les dades, eines de visualització com highcharts pels gràfics, i leaflet pels mapes. Ambdues eines permeten interacció per part del usuari.
7.- Quines dificultats vos heu trobat per a realitzar aquesta anàlisi i com les heu solventades?
La major part de les dificultats que hem anat trobant és la velocitat de càlcul d’aquestes anàlisis, quan fas prediccions pròpies i vols actualitzar-les el més aviat possible. Per anar resolent aquestes dificultats es treballa en millorar l’eficiència dels scripts que utilitzam i en augmentar la capacitat de càlcul dels equips informàtics, tant els nostres com els servidors cloud que tenim contractats.
8.- Quins són els resultats més significatius que podeu explicar?
Com hem dit, per nosaltres el Big Data és el dia a dia. Qualsevol servei o producte que oferim utilitza la informació generada per nosaltres, per dir-ho d’una forma senzilla, nosaltres treballam amb Big Data de manera operacional i rutinària. S’ha de tenir en compte que les prediccions puntuals que podem fer, per exemple, per un esdeveniment concret, surten d’aquestes grans matrius d’informació. El nostre objectiu és aprofitar aquesta gran quantitat d’informació pel màxim nombre possible de clients i usuaris. Les principals investigacions i avenços que fem és en generar noves maneres de visualitzar aquestes dades i que arribin al màxim nombre de sectors.
9.- Què aconsellau que estudiï a un jove que es vulgui dedicar a l’anàlisi i visualització de dades en el camp del Big Data?
Necessitarà una bona base de programació i capacitat per a aprendre nous llenguatges de programacióm ja que és un camp en constant evolució. A més també és importat tenir coneixements d’anàlisi de dades i matemàtics en general.
10.- I a un que es vulgui reciclar per a dedicar-se a aquest nou camp que ara sembla estar tan de moda?
La forma de reciclar-se i aprendre és fent-t’hi feina. Per tant, el millor és agafar un conjunt de dades de les moltes que hi ha de lliure descàrrega, tractar-les i visualitzar-les. Durant tot aquest procés hi ha nombrosos manuals i exemples en línia i una comunitat molt gran que dóna suport per anar superant els entrebancs.
12.- Ens pot recomanar una pel.lícula que inspiri allò en què està treballant?
Tot i que és Ciència ficció, i per tant no s’alinea amb la rigurositat d’allò que intentam aplicar a la nostra feina, crec que “El día de mañana” me va agradar i impactar. Just l’any que es va projectar, el 2004, jo començava a interessar-me en temes de canvi climàtic i me va servir per fer-me preguntes i trobar respostes.
13.- Ens pot recomanar un llibre que expliqui part del què està fent?
El meu dia a dia a l’empresa està més enfocat a la gestió i la comercialització. La meva recomanació aniria més cap a aquest sentit, per exemple, “El Método Lean Startup”.