4 czerwca 2009

Jak element HTMLa LINK fałszuje statystyki stron

Właśnie zakończyłem proces dodawania kodu zliczającego odsłony mojego nowego portalu GetSCJP.pl i przy okazji tegoż wykryłem ciekawą rzecz która ma niebagatelne znaczenie dla uzyskania dobrych, tj. prawdziwych danych. Otóż jeśli na mojej stronie HTML był element LINK z atrybutem REL o wartości 'next' to Firefox (wersja 3.0.10) oprócz pobierania tej strony o której pobranie został poproszony pobierał także stronę wskazywaną przez tenże element LINK. Co prawda element LINK z atrybutem REL o wartości 'next' służy właśnie dlatego by wskazać przeglądarce jaka strona jest "następna w kolejce do przeglądania" (zgodnie z jakimiś tam przewidywaniami) więc nie ma nic złego w tym że Firefox za wczasu pobiera taką stronę starając się wyprzedzić żądania użytkownika, jednak z punktu widzenia osoby implementującej statystyki oznacza to tylko i wyłącznie fałszowanie danych. Jeśli więc - kimkolwiek jesteś - chcesz uzystać dla swoich stron prawdziwe statystyki upewnij się lepiej, że takich elementów LINK na twoich stronach nie ma. Dodam jeszcze że IE nie wykazywał takich zapędów "optymalizacyjnych".

6 komentarzy:

Mateusz Grzechociński pisze...

Hej,

nie lepiej użyć Google Analytics i zapomnieć o problemie zliczania statystyk odwiedziń? :)

Mariusz Lipiński pisze...

A jesteś pewien, że Google Analytics jest "odporny" na tego typu zafałszowania? Chodzi o to, że Firefox rzeczywiście pobiera z serwera strony których żaden użytkownik nie żądał i nie oglądał. Każde narzędzie które liczy pobrania stron zostanie w ten sposób oszukane. No chyba że nasze narzędzie dodaje jakiś JavaScript do zdarzenia onClick na linkach, a więc de facto liczy kliknięcia w linki a nie pobrania stron. Fajnie, tylko że wtedy nie widzimy wizyt użytkowników którzy odwiedzają nasze strony poprzez bezpośrednie wpisanie linka albo poprzez link z innej, niezależnej od nas witryny. Ja uznałem, że bezpieczniej jest zliczać faktyczne pobrania stron (do czego używam odpowiedniego modułu mojego CMSa oraz DODATKOWO, własnego kodu "wstrzykniętego" w skrypty PHP serwujące strony i pliki).

gl0wa pisze...

Google Analytics używa JavaScript, pytanie czy Firefox wykonuje skrypty z wczytanej strony zaraz po jej pobraniu czy dopiero kiedy na nią wejdziemy. Jeżeli jest to drugi przypadek, to w takim razie nie ma problemu z fałszowaniem statystyk

Mariusz Lipiński pisze...

Trzeba by przeprowadzić testy. Ja też używam rozwiązania które wstrzykuje na strony jakiś JavaScript zliczający i to rozwiązanie (plugin do mojego CMSa) działało niepoprawnie, tj. dało się oszukiwać przez Firefoxa. Wnoszę stąd, że JavaScript wykonuje się tak jak podczas "normalego" pobrania strony.

KosciaK pisze...

Pytanie dodatkowe - czy mowa o czystym Firefoxie? Bo może to kwestia jakiegoś dodatku z ustawionym prefetchingiem (Fasterfox czy coś w tym stylu?)

Mariusz Lipiński pisze...

Czysty najzwyklejszy Firefox. Nie wiem jaka wersja - nie pamiętam już na którym komputerze robiłem testy.