On 13 Jun., 18:34, "Kurt G" <
kurt-n...@guldbaek.net> wrote:
> Kan man ikke indsætte kode, så man kan se, hvor de besøgende kommer fra og
> om det evt. er søgerobotter eller lignende, der skaber trafikken?
Fordelen ved at logge alle header data efter det princip, som Philip
bruger er, man kan søge igennem databasen med SQL. F.eks.:
SELECt * FROM header_data WHERE (accept_language LIKE "da" OR
accept_language LIKE "dk")
Med en vis sikkerhed giver det danske brugere udfra accept-language
(det sprog, som brugeren har sat browseren op til).
Man kan inkludere referer også, så man får alle referrers med, som har
".dk" i feltet for at se refererende danske hjemmesider.
osv...
Søgebotter angiver altid sig selv i user-agent sammen med en
henvisning til bottens hjemmeside. Hvis de ikke gør, er det - generelt
- ikke en søgebot, man skal tage seriøst.
I useragent kan man derfor søge på LIKE "http://" for at få alle
søgebotter (og visse eksterne services som f.eks. feed-readers).
Databasen skal så holdes ved lige. Jeg ville nok slette eller
backup'pe alle data ældre end en uge og sætte DBen til nul. Man kan
evt. bruge cron job til det, hvis man har adgang til sådan noget hos
hosteren.
Jeg har selv opdelt loggen i to, sådan at en selvstændig log også
logger POSt sessions, dvs. input fra en bruger som submitter en form.
Om det er nødvendigt, må man selv afgøre, jeg kan godt lide at vide,
hvad brugerne giver af rå input.
MVH
Rune Jensen