A l’anterior post d’anàlisi web introduírem que hi ha dos tipus principals d’eines per analitzar el tràfic que tenim a les nostres webs: els basats en l’activitat del servidor, i el de temps real. Avui intentarem explicar les seves diferències, i explicar per què entre ells es poden donar valors diferents.
- Com funcionen els basats en l’activitat del servidor?
Els servidors web, com l’Apache o l’IIS, generen un registre de les peticions rebudes a la web, amb informació sobre la consulta, la IP del client, la pàgina des d’on s’enllaça (referers), errors de la pàgina, i fins i tot informació sobre el tipus de navegador, sistema operatiu i resolució de pantalla de l’ordenador del client. A partir d’aquests registres, anomenats logs, disposam de programaris que interpreten les dades i generen informes estadístics sobre aquests. És el webmaster l’encarregat de decidir cada quan es fan les estadístiques (diàriament, setmanalment, …). El programador no ha d’incloure res d’especial dins de la web.
- Com funcionen els basats en temps real?
Aquests necessiten de petits fragments de codi incrustats dins de les nostres planes web, o al menys dins de les que volguem analitzar. Quan el client visita la nostra web, el seu navegador executa aquest codi i envia la informació directament dins d’una base de dades, preparada per extreure la informació desitjada. Els programaris llegeixen directament de la base de dades, i per tant la informació que podem extreure és en temps real.
- Per què els resultats no són iguals? Qui diu mentides ?
Ambdós, com hem comentat, utilitzen dades diferents, llavors cal saber interpretar les dades segons el que ens pot oferir cada un d’ells. La principal diferència radica en el mètode de contar les visites: en un fitxer de log es guarden com a “hits” tots els elements d’una plana web (així es comptabilitzen totes les imatges, els fitxers multimedia, documents, totes les parts de la web si aquesta té frames, …). És a dir, d’una plana visitada pot incloure més de 50 hits. En canvi, en els programaris basats en temps real d’una visita a una plana web només es comptabilitza una visita (desapareix el concepte de hit). D’aquí a que el nombre de pàgines visitades sigui distint. (Atenció: no vol dir que un hit sigui considerat un pàgina visitada, sinó que el mecanisme per definir una plana és diferent).
Però i per què tampoc coincideix el nombre de visites? És complicat extreure aquests valors. Els basats en les dades del servidor considera com a visitant únic cada IP diferent d’un client. Emperò en les xarxes de comunicacions hi ha molts d’elements que fan que aquesta variable no sigui exacta. La majoria de gent disposa d’IPs dinàmiques a les seves ADSL (és a dir, que el nostre proveïdor d’internet ens va canviant la nostra IP), moltes empreses surten tots per un mateix proxy (és a dir, tots els treballadors a tenen la mateixa IP), … Llavors aquestes dades són poc fiables. Els basats en temps real en canvi poden evitar aquests problemes de comunicacions al incloure cookies dins del navegador del client, llavors cada PC serà un visitant, independentment de la IP. Ara bé, i si dos persones utilitzen un mateix ordenador? Res és perfecte, però s’ajusta més a la realitat, no?
- Llavors, quin és millor dels dos sistemes?
La meva resposta serà: no és millor complementar-los? Vist les dades comentades els basats en temps real pareixen donar valors més ajustats “a la realitat”, tant en visitants com en planes webs; però també disposen d’altres desavantatges. Per exemple,
- els errors de les nostres webs només els podem detectar amb els basats en el servidor;
- els documents no HTML (és a dir els DOC, PDF, imatges, o qualsevol altre tipus de fitxer que tenguem) no es poden analitzar amb els basats en temps real (a no ser que siguin configurats a priori);
- a partir dels logs es poden analitzar webs en qualsevol moment, modificant paràmetres i/o configuracions per a obtenir les estadístiques desitjades; en canvi en temps real hem de tenir les configuracions desitjades a priori i, en cas de no tenir-les ja no es poden refer les estadístiques. Per exemple, si no introduïm el codi en una plana web, aquesta no existeix pel programari d’anàlisi, i al afegir-la no podrem conèixer valors passats.
- les estadístiques basades en temps real necessiten incloure programació, si bé webs basades en portals o CMS, ja disposen de plugins que ho fan automàticament; emperò sí es precisa d’un major coneixement del que s’està fent.
En definitiva, que és imprescindible a dia d’avui l’anàlisi de webs, i cal disposar d’eines per a tal efecte. Amb aquest post esperam haver aclarit una mica el tema, o si no, al menys posar-vos en coneixement de la problemàtica i/o possibilitats per tal d’ampliar els vostres coneixements mitjançant informació molt més extensa i acurada.