Ens agraden les empreses que expliquen com fan la seva feina. Avui entrevistam na Mar Muñoz, CEO en IT Travel Services. Seguim el seu blog i els volem agrair la pedagogia de com expliquen allò que fan.
L’anàlisi de dades a partir de diferents fonts d’informació, públiques i privades, aplicant diferents tècniques i tecnologies, és un tema complex, que necessita de divulgació, pedagogia, i casos d’estudi d’èxit per poder comprendre la magnitud de la seva importància. Entenem que cada projecte és únic en funció a l’estratègia empresarial de cada un.
Com ella es defineix: “positiva és el millor adjectiu que em defineix, i apassionada per la tecnologia, també. Porto en el món de la tecnologia orientada al turisme més de 20 anys i cada dia esdevé una oportunitat per aprendre i aplicar una mica nou en la transformació digital en la qual estem immersos. Abans desenvolupava tecnologia; ara, faig arribar la tecnologia com un facilitador per millorar processos de negoci basant-me en tècniques de Big Data per aconseguir-ho.
Líder generosa per naturalesa, creo entorns de treball eficients, basats en el respecte cap a cada persona del meu equip per potenciar les seves aptituds i generar alhora en ells un increment de motivació i confiança. Així doncs, engrandint el millor de cada un d’ells, aconseguim impactar positivament en els nostres clients, proveïdors i comunitat en general.”
Enginyera en Informàtica (per la UPM), Màster en Big Data (per la UNIR) i Programa Avançat sobre Direcció General (per IESE). Ha exercit diferents llocs de treball com a Direcció de Sistemes (9 anys a Barceló Viatges), Direcció d’eCommerce (3 anys en Barceló Viatges), Direcció Comercial i vendes (4 anys a eDreams i Barceló viatges), i actualment és CEO en IT Travel Services, on desenvolupen projectes de Big Data.
1. Ens pots descriure en què consisteix la teva feina?
Dins d’IT Travel gestiono la part comercial i de captació de clients i nous projectes. M’encarrego de visitar a clients i principalment la meva funció és, escoltar quins problemes tenen en el seu dia a dia, per intentar detectar si podem resoldre aquesta problemàtica. Normalment abans d’iniciar un projecte de Big Data, automatitzem algun procés que estan realitzant de forma manual i que els treu molt de temps, per a poder abordar nous projectes.
2. És viable per a una pime de pocs treballadors comanar un projecte d’anàlisi de dades o fins i tot de «big data»? Com són les empreses petites, no multinacionals, que sol·liciten aquests tipus de projectes?
Cal perdre la por als projectes de Big Data i no hauríem de creure que són cars, sense abans sol·licitar una proposta econòmica, perquè realment es poden fer coses molt útils sense una gran inversió. Avui dia el principal problema que tenim és que, els gerents desconeixen quina informació es pot obtenir de les dades i com la poden aplicar al seu negoci. Molts em parlen com si aquesta nova tendència, fos ciència ficció.
Les pimes que ens encarreguen aquests projectes tenen en la seva direcció a persones amb una visió estratègica molt innovadora. Entenen que aquesta tendència tecnològica els pot ajudar a millorar el seu negoci i no dubten a fer una inversió sempre que els expliquis quin serà el retorn.
3. Els projectes d’anàlisi de dades que manegeu, solen solucionar preguntes puntuals que necessiten una resposta a un moment donat o són projectes continus que van realitzant el seguiment dels creuaments de diferents variables constantment per trobar algun punt d’inflexió i prendre decisions en el mínim temps possible? Ens pots posar alguns exemples?
Normalment iniciem un projecte de BigData anem resolent preguntes en diverses fases. S’inicia el projecte per una pregunta, i l’anàlisi et porta a moltes més. Si posem un exemple i analitzem quina és la demanda real de certs productes a una web, la primera pregunta podria ser quin és el producte més demandat, però menys venut. Les següents preguntes serien, què li passa a aquest producte que es demana molt, però que no es ven, és només un tema de preu? O hi ha altres variables que impacten en el fet que no es vengui? Inicies el projecte per una pregunta, però a mesura que avances en l’anàlisi en sorgeixen moltes més.
4. Quan un pensa en «Big Data» pot venir al cap «Big Questions». Quines són les preguntes més freqüents que intenteu respondre amb l’anàlisi de dades? I les preguntes més insòlites?
Les preguntes depenen de l’àrea d’anàlisi, si ens centrem en l’àrea de màrqueting / comercial totes les preguntes van en relació a per què no venc més, o què he de fer per incrementar les meves vendes o disminuir els costos. A tots ens agradaria tenir la vareta màgica per incrementar any a any les vendes i arribar al pressupost marcat sense problemes i això és possible si fas un bon estudi de quin tipus de client tens i saps detectar què està demandant. En aquest sentit l’anàlisi de la demanda és bàsic.
5. Podem agafar d’exemple una pregunta que voleu respondre. Quines fonts de dades internes a l’empresa, externes públiques i externes de xarxes socials o webs necessiteu tenir a disposició per començar a analitzar?
En funció de les preguntes que es pretenguin respondre les fonts seran una o unes altres. No hi ha un projecte igual, i no sempre són necessàries totes les fonts esmentades en la pregunta.
Si pretenem detectar quins productes han deixat de comprar els nostres clients, l’única font necessària que es requereix és l’accés al sistema de facturació. Simplement explorant les dades que JA s’estan emmagatzemant en les organitzacions, en l’ERP, al CRM i en els sistemes interns, es pot realitzar un primer projecte de BigData.
Ara bé, si es pretenen crear models predictius com, per exemple, per poder establir pautes de comportament o repetició de compra o relació entre variables, es requereixen multitud de fonts tant internes com externes. En aquest tipus d’estudis intervenen moltes fonts: característiques del producte / establiment, anàlisi d’enquestes de qualitat per poder extreure l’índex de satisfacció del client, característiques del canal de compra, com és el comportament dels clients en xarxes socials, per quin mitjà publicitari interactua més, quines són les característiques socioeconòmiques dels clients, dades macroeconòmiques dels països d’origen dels nostres clients, i un llarg etc …
6. De quantes variables estam parlant? I registres?
Variables moltes i registres infinits, aquesta és la definició de BigData múltiples fonts de dades heterogènies i un gran volum de dades.
7. Els algoritmes es poden considerar com un secret industrial, si els utilitza una empresa?
Un algoritme es considera avui dia el know-how de les empreses, és a dir, la clau del seu avantatge competitiu. El cercador de Google, o el sistema de recomanació d’Amazon o qualsevol sistema de recerca en línia utilitza múltiples variables en funció de l’objectiu que persegueixi l’empresa. Així que, sí, es pot arribar a considerar secret industrial, perquè darrere de l’algoritme està l’estratègia de l’empresa. Seria com desvetllar la fórmula de la coca cola.
El que passa és que un algoritme en ser fórmules matemàtiques no es pot patentar o considerar propietat intel·lectual, no hi ha una llei que els empari o que els pugui considerar com a patents. En aquest sentit hi ha un ampli camí per recórrer en matèria de legislació.
8. Creus que els algoritmes que utilitzen les administracions públiques haurien de ser públics?
Si, els algoritmes de les administracions públiques haurien de ser públics, bàsicament perquè tracten amb dades personals dels ciutadans i tots hauríem de saber què es fa amb les nostres dades i amb quin objectiu.
Les administracions públiques tenen accés a moltes fonts de dades del ciutadà, dades personals, acadèmiques, patrimonials, censals, etc., i amb més motiu s’ha de conèixer l’objectiu de l’algoritme/estudi. Hem de recordar que la llei atribueix al ciutadà la titularitat, el control i el tractament d’aquestes dades, i que prèviament hem hagut de ser informats de l’objectiu de l’estudi.
9. Pot afectar un algoritme que pren decisions sobre un individu el seu futur? El podria perjudicar?
Els algoritmes predictius es basen en un conjunt de dades sobre les quals es determinen unes pautes de comportament o per generar-ne “semblants” dels que l’algoritme va aprenent i categoritzant. Pot ser totalment perillós prendre decisions a partir d’un conjunt de dades incomplet. Els estudis, algoritmes i l’aplicació de la intel·ligència artificial s’han de realitzar amb rigor i encara que hi ha una tendència a confiar totalment en la màquina, no hem de reemplaçar-la per una decisió humana.
Si els algoritmes no s’utilitzen d’una manera adequada o amb un set de dades correctes, es poden prendre decisions que poden afectar de manera negativa a l’individu i el pitjor és que les persones afectades ni tan sols saben que la seva vida s’està veient afectada pel resultat d’aquest algoritme.
10. Quina ètica s’ha d’aplicar als algoritmes?
Sempre es parla de si la tecnologia és bona o dolenta, igual que si ens demanem si un ganivet és bo o dolent. La resposta seria segons l’ús que li donem. El que és un fet és que la tecnologia està per tot arreu i no hi ha marxa enrere. Ara es tracta de si volem dirigir la tecnologia o que la tecnologia ens dirigeixi a nosaltres.
No només hem de parlar d’ètica, sinó de molts conceptes que no s’han de perdre de vista, com la transparència dels algoritmes, l’aplicació de la seguretat, preservar la privacitat personal, la responsabilitat i els valors humans.
11. En el vostre blog hem llegit que utilitza diferents tecnologies per a analitzar dades, ens pot descriure una mica quins són i en què consisteixen aquests programes informàtics, quin cost tenen, i si els té en servidors propis o en el núvol?
Hi ha moltes tècniques que es poden aplicar per a l’anàlisi de les dades. A continuació, us detallo les que més s’utilitzen amb algun exemple d’aplicació.
1) Regles d’associació: Permeten descobrir relacions rellevants o regles d’associació, entre variables de dades. Es basen en una gran varietat d’algorismes que generen i proven possibles regles. Una de les seves aplicacions és per a l’anàlisi de quins productes es compren amb freqüència junts.
2) Classificació: Conjunt de tècniques per identificar la categoria a la qual pertany un nou conjunt de dades basant-se en classificacions realitzades amb anterioritat. Aquestes tècniques es denominen d’aprenentatge supervisat perquè parteixen d’un conjunt de dades d’entrenament amb conjunts de dades ja classificats. S’utilitzen per exemple en els sistemes de recomanació per ajudar l’usuari a planificar el seu viatge o allò que farà en una ciutat. Un altre cas d’ús molt freqüent és la predicció del comportament del client en les decisions de compra.
3) Anàlisi de grups (clustering): Mètode estadístic per a la classificació d’objectes que es basa a dividir un grup d’elements en grups més petits d’objectes similars, les característiques de similitud no es coneixen per endavant. Un exemple d’utilització del clustering és en la segmentació de consumidors en grups anàlegs per a realització de campanyes de màrqueting concretes.
4) Models predictius: Tècniques mitjançant les quals es crea o tria un model matemàtic per predir la probabilitat d’un resultat. Un exemple d’aplicació és la predicció amb temps de l’entrada de turistes estrangers i les pernoctacions previstes. Exemple: podem predir amb quina antelació per nacionalitat i totes les pernoctacions tindrem, per la qual cosa podem orientar el producte d’extres en un hotel, per exemple.
5) Anàlisi de xarxes: Conjunt de tècniques utilitzades per caracteritzar les relacions entre nodes en un gràfic o una xarxa. Molt utilitzat en l’anàlisi de xarxes socials per a determinar les connexions entre els individus d’una comunitat, com viatja la informació, o qui té major influència sobre qui.
12. En cas que estiguin en el núvol, quin ample de banda mínim necessita perquè funcionin òptimament?
En aquest cas depèn molt del volum de dades que estiguis manejant. Avui en dia estem generant un volum molt gran de dades, però realment hem de preocupar-nos de la qualitat d’aquestes dades. És normal que es pensi en l’emmagatzematge, la connectivitat, la potència i la latència per realitzar un bon projecte de Big Data, primer hem de plantejar-nos quina capacitat d’anàlisi tenim, ja que, tot el que es guardi, en teoria hauríem de poder analitzar-ho . I en funció d’aquest criteri, adeqües teva infraestructura tant de màquines com l’ample de banda.
13. Sembla que hi ha una gran demanda de feina per treballar en aquests camps de l’anàlisi de dades, quina formació es necessita per a poder-hi treballar? Quines tecnologies bàsiques cal dominar?
En la majoria dels projectes de BigData hi intervenen diversos perfils, no tots són tècnics, perquè no tot el que s’ha de resoldre és tecnològic, hi ha moltes tasques que es resolen amb sentit comú. Els principals perfils són:
• D’una banda, hi ha els arquitectes de sistemes que són els encarregats del muntatge físic del sistema d’emmagatzematge i processament de dades. Són perfils molt tècnics especialitzats en HW i Comunicacions.
• D’altra banda, hi ha els perfils d’intel·ligència de negoci, algú que no necessàriament és tècnic, que coneix molt bé el negoci i sap quines preguntes fer a totes aquestes dades en brut. Hi ha vegades que aquest perfil fa de “traductor” entre el client i el tècnic, ja que, coneix perfectament el sector per saber què necessita el client i després té habilitats tècniques per indicar-li a un informàtic allò que es pretén realitzar.
• També tenim als analistes de dades, aquelles persones tècniques que donada la pregunta a realitzar tenen els coneixements tècnics i / o matemàtics per desenvolupar la consulta i / o algoritme.
• Intervenen també els perfils de Visualització de Dades, que tenen molta visió espacial, i que saben perfectament com aquestes dades encaixaran en un tipus de gràfic determinat. Són perfils més de màrqueting amb molt d’interès en la representació gràfica de les dades.
14. Ens pots recomanar un llibre i una pel·lícula que li hagi inspirat en la seva professió?
AVATAR és una de les meves pel·lícules favorites i en general qualsevol pel·lícula de ciència ficció que em faci somiar. En el meu treball tendeixo a somiar i pensar que tot és possible, i amb recursos, temps i gràcies a la bona aplicació de la tecnologia, per a mi, TOT ÉS POSSIBLE.
I llibres m’enganxo a qualsevol novel·la històrica o de fantasia, m’encanta la narrativa de Julia Navarro, María Dueñas, Noah Gordon, Carlos Ruiz Zafón o Ken Follet, etc …. Hi ha molts de llibres, moltes temàtiques, molts autors als quals admiro, i si n’hagués de triar un, em quedo amb “Dispara, jo ja estic mort”, de Julia Navarro, per la combinació de misteri, aventura, emocions i pel fet d’estar encaixant peces d’un gran puzle.