Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Eine Browserstatistik?

4 views
Skip to first unread message

Dominik Boecker

unread,
May 26, 2002, 1:12:29 PM5/26/02
to
Hi zusammen,

X-Post dciwam + dciwpm, f'up2dciwpm

| Hat jemand eine Browserstatistik für mich?

Bevor ihr mir jetzt kollektiv den Kopf abreißt eine Bitte:
<http://www.dodabo.de/netz/statistik.html> Ich hab' mal versucht ein
paar Probleme dieser Statistiken zusammenzufassen. Hat jemand
Anmerkungen, Ergänzungen, weitere Vorschläge (Verbesserungen in der
Auszeichnung?) zu dem Dokument?

Dominik
--
Die Gotterspammerung - Junkmail of the Gods

Jens Peter

unread,
May 26, 2002, 1:59:15 PM5/26/02
to
Hi Dominik,

Browserstatistiken in der Form "Das ist der meist genutzte Browser im
Internet" sind Quatsch. Suchst Du sowas?
Sie sind Quatsch, weil man dazu eine Längs- oder Querschnitt Untersuchung
benötigen würde, die zum Zeitpunkt "X" zeitgleich alle Webserver der Welt
erfassen müsste. Das ist meines Wissens derzeit technisch nicht möglich.

"Messen" ist also relativ, wie du ja selbst erkannt hast.

> | Hat jemand eine Browserstatistik für mich?

Geht's ein bißchen genauer welchen Zeitraum hättest Du den gern
berücksichtigt? Willst du 300 MB an Log-Files?

> paar Probleme dieser Statistiken zusammenzufassen. Hat jemand
> Anmerkungen, Ergänzungen, weitere Vorschläge (Verbesserungen in der
> Auszeichnung?) zu dem Dokument?

Diese Aussagen können durch die Logfiles gemacht werden:
- Wieviel PageViews vom Browser XY erzeugt wurden,
- Wie lange von einer IP auf die Seite zugegriffen wurde,
- Wieviel Datenmenge and diese IP ging,
- Wie sich Werbemaßnahmen auf die "PageViews" auswirken,
- Welche Seiten nicht vollständig geladen wurden,
- Wo Fehler auftraten,
- Wie sich sich Mensch oder Machine mit IP XY durch die Seiten bewegt
[Da bin ich nicht sicher!]

Das sind doch gute Sachen. Das fände ich wichtig zu erwähnen. Sagt einer,
der immer noch niocht weiß, ob Logfiles analyse kostengünstiger als die
Entwicklung und Anwendung von Nutzertests ist.

MfG
Jens

Steffi Abel

unread,
May 26, 2002, 3:31:57 PM5/26/02
to
"Dominik Boecker" <ungelesen...@dominik-boecker.de> schrieb:

> Bevor ihr mir jetzt kollektiv den Kopf abreißt

ich war schon kurz davor.

> eine Bitte:
> <http://www.dodabo.de/netz/statistik.html> Ich hab' mal versucht ein
> paar Probleme dieser Statistiken zusammenzufassen. Hat jemand
> Anmerkungen, Ergänzungen, weitere Vorschläge (Verbesserungen in der
> Auszeichnung?) zu dem Dokument?

Es fehlt die Erklärung, warum es - selbst wenn es ginge - unsinnig
ist, zu versuchen, Daten wie Browserhersteller, Browserversionen u.
dgl. zu erheben:

Solche Daten sind Stichproben, aus denen man versucht Rückschlüsse auf
die Grundgesamtheit zu ziehen. Dies macht nur dann Sinn, wenn das
Wissen über die Grundgesamtheit genutzt wird, um Strategien für die
nahe und/oder ferne Zukunft zu entwerfen.

Daher wird man vernünftiger Weise nur Daten erheben, a) die über einen
gewissen Zeitraum konstant bleiben werden und b) deren Verteilung
Auswirkung auf die zu entwickelnde Strategie(n) haben.

Berücksichtigt man Punkt a), stellt sich die Frage, welchen Sinn es da
macht, zu versuchen, Browserhersteller zu erfassen. Selbst wenn es
eine Möglichkeit gäbe, mit 100%iger Sicherheit zu sagen, x% aller
Browser sind IE 6 und y% aller Brwoser sind NN 6, sieht dies u. U.
nächste Woche völlig anders aus - nämlich dann, wenn der AOL-Browser
nicht mehr IE sondern Mozilla heißt oder wenn bei der
Standard-Installation von T-Online der IE 7 installiert wird.

Berücksichtigt man Punkt b) stellt sich die Frage nach der Qualität
der erhobenen Daten. Was nützt es einer profitorientierten Site zur
Entwicklung einer Strategie, zu wissen, dass 80% aller User IE 6
verwenden, wenn 90% dieser User über ein monatl.
Haushaltsnettoeinkommen von 50 EUR (AKA Taschengeld) verfügen?

Sinnvoller wäre da eine Strategie, die auf die 15% NN4-User Rücksicht
nimmt, von denen u. U. 90% über ein monatl. Haushaltsnettoeinkommen
von 5.000 EUR verfügen.

Für eine Site mit 5.000 Usern ergäbe sich mit den o. g. Zahlen
folgende Rechnung:

80% (=4.000 User) verwenden IE 6, 90% davon (=3.600 User) sind
Taschengeldempfänger. Das bedeutet, 400 der IE 6 User sind
wirtschaftlich interessant.

15% (=750 User) verwenden NN 4, 90% davon (=675 User) sind reich. Das
bedeutet, 675 der NN 4 User sind wirtschaftlich interessant.

Was bedeutet das für unsere Strategie? Der Autor, der aufgrund seiner
Statistiken auf 80% seiner User "Rücksicht nimmt" (was immer das
bedeuten mag), begeht einen Fehler, dagegen handelt der Autor, der
"nur" auf 15% seiner User Rücksicht nimmt, klug.

Wenn es aber klüger ist, auf 15% der User Rücksicht zu nehmen, als auf
80% der User, drängt sich doch die Frage auf, warum ein Autor
Browserverteilungen zählen soll.

Sicher, am klügsten handelt der Webdesigner, der auf alle Rücksicht
nimmt - was uns erneut zur Ausgangsfrage nach dem Sinn solcher
Statistiken bringt.

Gruß Steffi

Steffi Abel

unread,
May 26, 2002, 3:50:51 PM5/26/02
to
"Jens Peter" <jens....@foni.net> schrieb:

> Diese Aussagen können durch die Logfiles gemacht werden:
> - Wieviel PageViews vom Browser XY erzeugt wurden,

Nein, da sich nicht alle Zugriffe von Browser XY zählen lassen.

> - Wie lange von einer IP auf die Seite zugegriffen wurde,

Ich tippe in die Adresszeile meines Browsers www.spiegel.de ein. Wo in
Augsteins Logfile steht, wie lange ich auf die Ressource
http://www.spiegel.de/ zugegriffen habe?

> - Wieviel Datenmenge and diese IP ging,

ist in etwa so sinnvoll wie GETs und POSTs zu zählen.

> - Wie sich Werbemaßnahmen auf die "PageViews" auswirken,

Da du "PageViews" nicht zählen kannst, kannst du natürlich auch nicht
zählen, ob eine bestimmte Werbemassnahme "PageViews" generierte.

> - Welche Seiten nicht vollständig geladen wurden,

Stimmt. Und alle anderen Stati kannst du auch zählen.

> - Wie sich sich Mensch oder Machine mit IP XY durch die Seiten
> bewegt [Da bin ich nicht sicher!]

Jetzt bist du sicher: das geht nicht.

> Das sind doch gute Sachen.

Was jetzt?

> Das fände ich wichtig zu erwähnen. Sagt einer,
> der immer noch niocht weiß, ob Logfiles analyse kostengünstiger als
> die Entwicklung und Anwendung von Nutzertests ist.

Ist sie nicht, da die gewonnenen Zahlen fast immer falsch sind. Und
falsche Zahlen als Grundlage für Kalkulationen zu verwenden ist
kostspielieger, als gar keine zu verwenden.

Gruß Steffi

Jens Peter

unread,
May 26, 2002, 4:50:57 PM5/26/02
to
Hi Steffi,

"Steffi Abel" schrieb im Newsbeitrag news:acref7$rtcl6$1@ID-


> > Diese Aussagen können durch die Logfiles gemacht werden:
> > - Wieviel PageViews vom Browser XY erzeugt wurden,
>
> Nein, da sich nicht alle Zugriffe von Browser XY zählen lassen.

Meinst, Du Seiten die schon im Cache des Browsers, oder auf einem Proxy
liegen bis sie wieder von der Orginaladresse aufgerufen werden?

> > - Wie lange von einer IP auf die Seite zugegriffen wurde,
>
> Ich tippe in die Adresszeile meines Browsers www.spiegel.de ein. Wo in
> Augsteins Logfile steht, wie lange ich auf die Ressource
> http://www.spiegel.de/ zugegriffen habe?

Na, die kannst die Zeitspanne "Einstiegsseite - 'Klick throughs' -
Ausstiegsseite" messen. Da kann man ja sagen wenn es nach einer halben
Stunde keinen Referrer innerhalb des Projekts gibt, dann war der Besucher
mehr als eben mal noch ne Tasse Kaffe zu kochen.

> > - Wieviel Datenmenge and diese IP ging,
>
> ist in etwa so sinnvoll wie GETs und POSTs zu zählen.

Daran kannst Du eine Vermutung anstellen, ob es sich um einen Proxie oder
eine PC handelt.


> > - Wie sich Werbemaßnahmen auf die "PageViews" auswirken,
>
> Da du "PageViews" nicht zählen kannst, kannst du natürlich auch nicht
> zählen, ob eine bestimmte Werbemassnahme "PageViews" generierte.

Ich bin gegenteiliger Meinung.


> > - Welche Seiten nicht vollständig geladen wurden,
>
> Stimmt. Und alle anderen Stati kannst du auch zählen.

Ah, eine Zustimmung :-)

> > - Wie sich sich Mensch oder Machine mit IP XY durch die Seiten
> > bewegt [Da bin ich nicht sicher!]
>
> Jetzt bist du sicher: das geht nicht.

Mensch/Maschine loggt sich automatisch über Cookie, oder personalisierte
Homepage. Aber es bringt wahrscheinlich nicht viel.


> > Das sind doch gute Sachen.
>
> Was jetzt?

Jetzt werde ich bei wirklich wichtigen Projekten Nutzertests durchführen.


> > Das fände ich wichtig zu erwähnen. Sagt einer,
> > der immer noch niocht weiß, ob Logfiles analyse kostengünstiger als
> > die Entwicklung und Anwendung von Nutzertests ist.
>
> Ist sie nicht, da die gewonnenen Zahlen fast immer falsch sind. Und
> falsche Zahlen als Grundlage für Kalkulationen zu verwenden ist
> kostspielieger, als gar keine zu verwenden.

Du hast soeben den manchem kommerziellen ICP (Internet Content Provider) den
Geldhahn abgedreht. Wie heißt die Firma "Doppelklick" LOL

CU
Jens


Freddy Leitner

unread,
May 26, 2002, 5:15:32 PM5/26/02
to
Jens Peter schrieb:

>Na, die kannst die Zeitspanne "Einstiegsseite - 'Klick throughs' -
>Ausstiegsseite" messen.

Festhalten: Bei AOL-Kunden kommt /jede/ Anfrage ueber eine andere IP.
Selbst wenn es ein- und derselbe Kunde ist, selbst wenn es ein- und
dieselbe Seite sind, sogar wenn eine HTML-Seite Bilder nachlaedt kommen
die Anfragen von verschiedenen IPs. Ein System von transparenten Proxies
sorgt dafuer.

Un nu? Wie verfolgst Du einen Pfad eines solchen Benutzers?

Statistiken sind grobe Schaetzungen und als solche zu behandeln. Wer
stichhaltige Zahlen erwartet, hat das Prinzip nicht verstanden.

- Freddy

--
Freddy Leitner "Ich gebe Zucker in den Kaffee, und der Kaffee
ankylometai wird sofort total deprimiert, weil ich ihn nicht
dre...@dreamer.net so akzeptieren kann, wie er ist." - Josef Hader

Jens Peter

unread,
May 26, 2002, 5:37:36 PM5/26/02
to
Hi Freddy,

"Freddy Leitner"news:acrj9f$s8qvd$1...@ID-28249.news.dfncis.de...

> Jens Peter schrieb:
>
> >Na, die kannst die Zeitspanne "Einstiegsseite - 'Klick throughs' -
> >Ausstiegsseite" messen.
>
> Festhalten: Bei AOL-Kunden kommt /jede/ Anfrage ueber eine andere IP.
> Selbst wenn es ein- und derselbe Kunde ist, selbst wenn es ein- und
> dieselbe Seite sind, sogar wenn eine HTML-Seite Bilder nachlaedt kommen
> die Anfragen von verschiedenen IPs. Ein System von transparenten Proxies
> sorgt dafuer.
>
> Un nu? Wie verfolgst Du einen Pfad eines solchen Benutzers?

RDBMS, Was denkst Du wie Amzon funktioniert?

Chapter 9: User Tracking

by Philip Greenspun, part of Philip and Alex's Guide to Web Publishing
http://www.arsdigita.com/books/panda/user-tracking


> Statistiken sind grobe Schaetzungen und als solche zu behandeln. Wer
> stichhaltige Zahlen erwartet, hat das Prinzip nicht verstanden.

Wir reden schon über "Inhalt Personalisierung". Statistik ist mir noch ein
Rätsel. Definiere stichhaltig, Wahlprognosen sind verläßlicher als
Wettervorhersagen.

CU
Jens

Steffi Abel

unread,
May 26, 2002, 5:42:01 PM5/26/02
to
"Freddy Leitner" <dre...@dreamer.net> schrieb:

> Festhalten: Bei AOL-Kunden kommt /jede/ Anfrage ueber eine andere
> IP.

Mensch Freddy, auf die paar Mio "Meßfehler" ist doch wirklich gesch...

> Statistiken sind grobe Schaetzungen

Statistiken sind weit mehr als das. Dass die mehr oder weniger
willkürlich ermittelten Zahlenreihen, die sich Browser"statistiken"
nennen, keine Statistiken sind, ändert daran nichts.

Gruß Steffi

Steffi Abel

unread,
May 26, 2002, 5:43:38 PM5/26/02
to
"Jens Peter" <jens....@foni.net> schrieb:

> > > - Wieviel PageViews vom Browser XY erzeugt wurden,
> >
> > Nein, da sich nicht alle Zugriffe von Browser XY zählen lassen.
>
> Meinst, Du Seiten die schon im Cache des Browsers, oder auf einem
> Proxy liegen bis sie wieder von der Orginaladresse aufgerufen
> werden?

unter anderem.

> > > - Wie lange von einer IP auf die Seite zugegriffen wurde,
> >
> > Ich tippe in die Adresszeile meines Browsers www.spiegel.de ein.
> > Wo in Augsteins Logfile steht, wie lange ich auf die Ressource
> > http://www.spiegel.de/ zugegriffen habe?
>
> Na, die kannst die Zeitspanne "Einstiegsseite - 'Klick throughs' -
> Ausstiegsseite" messen.

Das setzte voraus, dass es möglich ist, die "Ausstiegsseite" zu
bestimmen. Lies dazu auch news:ac1beo$lsrvb$2...@ID-143025.news.dfncis.de
vom 17.05. d. J.

> Daran kannst Du eine Vermutung anstellen, ob es sich um einen Proxie
> oder eine PC handelt.

Selbst wenn das stimmte, welchen Nutzen hätte diese Information?

> > Da du "PageViews" nicht zählen kannst, kannst du natürlich auch
> > nicht zählen, ob eine bestimmte Werbemassnahme "PageViews"
> > generierte.
>
> Ich bin gegenteiliger Meinung.

Gespannt warte ich auf die Erklärung, wie du meinst, zuverlässig
"PageViews" zählen zu können.

> > > - Wie sich sich Mensch oder Machine mit IP XY durch die Seiten
> > > bewegt [Da bin ich nicht sicher!]
> >
> > Jetzt bist du sicher: das geht nicht.
>
> Mensch/Maschine loggt sich automatisch über Cookie, oder
> personalisierte Homepage. Aber es bringt wahrscheinlich nicht
> viel.

Auch hier die Leseempfehlung
news:ac1beo$lsrvb$2...@ID-143025.news.dfncis.de ff.

> Jetzt werde ich bei wirklich wichtigen Projekten Nutzertests
> durchführen.

Um was herauszufinden?

> Du hast soeben den manchem kommerziellen ICP (Internet Content
> Provider) den Geldhahn abgedreht.

Das muß ich gar nicht. Hast du dir noch nie Gedanken gemacht, warum
eine Firma nach der anderen dieser Branche den Bach runter geht? Oder
warum keines der Unternehmen, deren Geschäftsidee auf der Annahme
basiert, man können Browser, Auflösungen, Pageimpressions, Pageviews,
Hits und dgl. zählen, profitabel arbeitet?

Gruß Steffi

Steffi Abel

unread,
May 26, 2002, 5:51:31 PM5/26/02
to
"Jens Peter" <jens....@foni.net> schrieb:

> Was denkst Du wie Amzon funktioniert?

definiere "funktionieren". Ein Unternehmen, dass es in wenigen Jahren
geschafft hat, einen 4stelligen Millionenbetrag Verlust anzuhäufen,
bezeichne ich nicht als "funktionierend".

Gruß Steffi

Dominik Boecker

unread,
May 27, 2002, 2:06:03 PM5/27/02
to
Steffi Abel <ab...@s.netic.de> wrote:

> "Dominik Boecker" <ungelesen...@dominik-boecker.de> schrieb:
>
> > Bevor ihr mir jetzt kollektiv den Kopf abreißt
>
> ich war schon kurz davor.

Dachte ich es mir schon... :-)

> > <http://www.dodabo.de/netz/statistik.html>

> Es fehlt die Erklärung, warum es - selbst wenn es ginge - unsinnig
> ist, zu versuchen, Daten wie Browserhersteller, Browserversionen u.
> dgl. zu erheben:

Ich habe es nach <http://www.dodabo.de/netz/statistik.html#gesamt> mal
ergänzt.

> Berücksichtigt man Punkt b) stellt sich die Frage nach der Qualität
> der erhobenen Daten. Was nützt es einer profitorientierten Site zur

> Entwicklung einer Strategie, zu wissen, dass [...]

Ich war so frei und hab' Dein Beispiel fast unverändert übernommen (Ist
das in der gemachten Form für Dich OK?) und Dein Posting bei Google
verlinkt, denn das bekomme ich nicht besser dargestellt.

Dominik
--
Am 7. Oktober 1950 fielen chinesische Soldaten in Tibet ein. Das Land
ist bis heute chinesisch besetzt. 1951 fiel die Hauptstadt Tibets,
Lhasa. Der Dalai Lama mußte ins Exil fliehen, wo er sich noch heute
aufhält.

Dominik Boecker

unread,
May 27, 2002, 3:03:50 PM5/27/02
to
Jens Peter <jens....@foni.net> wrote:

> Chapter 9: User Tracking
>
> by Philip Greenspun, part of Philip and Alex's Guide to Web Publishing
> http://www.arsdigita.com/books/panda/user-tracking

Von denselben Autoren, die auch "Learn to Program HTML in 21 Minutes"
veröffentlichen?

Naja, ich bleibe mal beim Thema:

Dort wird das Thema Proxy auch angesprochen (wie sehr kurz auch bei mir)

| What are the subtleties here? First, the user might be coming through
| a caching proxy server. America Online, for example, doesn't let most
| of its users talk directly to your Web server. [...]

Dann spricht er eine Lösung mit Cookies an und erwähnt auch die Probleme
damit (insbesondere, wenn ein User keine Cookies annimmt). Dann kommt er
auf click-through.

Später ein kleiner Kommentar von ihm:
| The first lesson to be drawn from this example is that Anne is a
| genius. The second is that an afternoon hack, even by a genius, isn't
| enough to solve the personalization problem. Yet if you cut through
| the crust of hype that surrounds any of the expensive Web server
| personalization software "solutions", all that you find underneath is
| Anne's afternoon hack.  

Der einzige scheinbar funktionierende Weg, den er aufzeigt ist der von
Amzon und da hat Steffi schon was zu gesagt.

> > Statistiken sind grobe Schaetzungen und als solche zu behandeln. Wer
> > stichhaltige Zahlen erwartet, hat das Prinzip nicht verstanden.
> Wir reden schon über "Inhalt Personalisierung".

Zumindest ich hatte mit der Erhebung von Zahlen zwecks Statistik
angefangen.

> Statistik ist mir noch ein Rätsel. Definiere stichhaltig, Wahlprognosen
> sind verläßlicher als Wettervorhersagen.

Und selbst letztere sind idR genauer als die Zahlen, die man von
&irgendwo; für (s)eine Statistik herbekommt.

Dominik
--
"Die großgeschriebenen Substantive sind die Leuchttürme über dem Satz,
und der Satz kann sie brauchen - um so dringender, je schlimmer er
verschachtelt ist." (Wolf Schneider)

Sim

unread,
Jun 4, 2002, 10:37:01 AM6/4/02
to
Das Problem bei den Ganzen lustigen Logfile-Analysen ist einfach:

man hat kaum eine Datenbasis, auf die man sich verlassen lässt. Jeder Wert
den ich im Log festhalten kann, könnte verfälscht sein & ist es meistens
auch (Referrer, IP, UserAgent,...)

> Diese Aussagen können durch die Logfiles gemacht werden:
> - Wieviel PageViews vom Browser XY erzeugt wurden,

Schwierig, weil sich die nicht-Mainstream Browser meist als
Mainstream-Browser ausweisen, um überhaupt etwas angezeigt zu bekommen. Kaum
jemand der unter Linux Konqueror verwendet lässt den Konqueror auch diese UA
Kennung mitschicken, da man oft von Browserweichen (wäh) ins Nirvana
geschickt wird, etc.

> - Wie lange von einer IP auf die Seite zugegriffen wurde,

Das mit der IP ist so eine Geschichte. Wie schon erwähnt haben AOL und
ähnliche ein komplexes Proxy-System, das IP's wild herumshuffelt. Mittels
Forwarded_For und ähnlichem kann man der IP zwar näher kommen, aber niemand
(kein Proxy) ist verpflichtet diese Infos mitzuschicken und Firewalls
verstecken sowas ja bewußt...

> - Wieviel Datenmenge and diese IP ging,

IP?

> - Wie sich Werbemaßnahmen auf die "PageViews" auswirken,

Das verstehe ich nicht. PageViews definier ich mal ganz wild als
Content-Seiten Abrufe (also Abrufe von Navitationsseiten und ähnlichem
interessieren uns nicht).
Das bringt uns zum System der Webbugs - damit lässt sich per SessionCookie
(und absteigende Usererkennung bis hin zu JS & Hashcode über Browser/OS/IP)
zumindest die Anzahl der PageViews recht gut annähern.

> - Wo Fehler auftraten,
Jo! Die Error-Codes der Logfiles auszuwerten ist hoffentlich eine
Pflichtübung für jeden WebAdmin.

> - Wie sich sich Mensch oder Machine mit IP XY durch die Seiten bewegt
> [Da bin ich nicht sicher!]

Mittels Webbugs hat man zumindest einen Näherungswert.

> Das sind doch gute Sachen. Das fände ich wichtig zu erwähnen. Sagt einer,
> der immer noch niocht weiß, ob Logfiles analyse kostengünstiger als die
> Entwicklung und Anwendung von Nutzertests ist.

Logfileanalyse und die daraus gewonnen Daten sind auf jeden Fall wichtig für
den Online-Markt und werde auch weiter an Bedeutung gewinnen. Zwar ist das
Ganze in gewissen Teilen eine Raterei aber die Methoden zur Erfassung eines
Werbe(miß)erfolges sind zumindest besser wie in den klassischen Medien
Print,TV,..

gruß
simon


Simon Oberhammer

unread,
Jun 4, 2002, 10:38:29 AM6/4/02
to
sorry für das anonyme post :)


Jens Peter

unread,
Jun 5, 2002, 12:19:04 PM6/5/02
to
Hi Simon,

danke für Deinen Beitrag den ich sehr interssant finde.

> ... Jeder Wert


> den ich im Log festhalten kann, könnte verfälscht sein & ist es meistens
> auch (Referrer, IP, UserAgent,...)

Jeder Wert kann verfälscht sein, das sehe ich anders. (Irrtümer und
schlechte Tage vorbehalten). Auch ein verfälschter Wert ist ein Wert, auch
ein nicht vorhandener Wert ein meßbareres Ergebnis. Ich versuche das
greifbarer zu machen:

Referrer:
Irgend einen Referrer hat man oder hat man nicht. Für den Fall
das wir Referrer haben, woher können Referrer stammen? Andere Webseite oder
Proxy oder Server. Richtig?

IP:
Wir haben eine IP Adresse. Die haben wir doch immer, ja? Es ist mir zunächst
egal ob die zu einem Server oder zu einer Workstation führt.

UserAgent:
Auch hier bekommen wir meist eine Kennung, auch wenn dies nnicht dier
Kennung des jeweiligen User Agent sein muß. Wenn der Opera User mit Mozilla
5 als Kennung durch die Gegend surft, dann folgere ich, das er gerne die
Seiten mit "Mozilla Augen" sehen möchte.


> Kaum jemand der unter Linux Konqueror verwendet lässt den Konqueror auch
diese UA
> Kennung mitschicken, da man oft von Browserweichen (wäh) ins Nirvana
> geschickt wird, etc.

Da gehört mal den Entwicklern von nicht Mainstream Browsern gesagt, daß sie
im Browser einen schnellen Wechseldialog der Kennung anbieten oder die
Kennung "on demand" nur für die Verbindung mit einer bestimmten Webseite
anbieten und danach wieder in die Standardkenung gehen.
Das wäre ein unheimlicher Gewinn für das Internet.
Nicht-Mainstreambrowser würden eine stärkere Verbreitung finden, da sie mehr
in Browserstatistiken auftauchen würden. Microsoft und Netscape würden unter
Druck geraten und Standard konformere Browser entwickeln. Webautoren würden
aufhören hirnlose Browserweichen zu schreiben (Diese Seite kann nur...) und
ein Pluralismus der Betreibssysteme würde innovativere Software liefern. O
Du schöner Zukunftstraum.

> (kein Proxy) ist verpflichtet diese Infos mitzuschicken und Firewalls
> verstecken sowas ja bewußt...

siehe IP oben

Heutigen AOL Usern kann man alles verkaufen, ja moment vielleicht sollte ich
die zu meiner bevorzugten Zielgruppe machen. Interessanter Gedanke und ein
guter Grund eine Geschäftpartnerschaft mit AOL einzugehen. Sollte ich mal
was für Senioren oder die +40 Generation verkaufen wollen, werde ich das
eventuell tun.

> IP?
Sorry, Gemeint ist natürlich Internet Protocoll Adresse z.B. 62.214.12.13

62.214.12.13 - - [20/Nov/2001:04:04:48 +0100] "GET /managementnacht.htm
HTTP/1.1" 200 2476 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows 98;
QXW03363)"
Ich versuch mal diese Logfile Zeile auszuwerten.

Am "20. November 2002" wurde um "4 Uhr Nachts deutscher Winterzeit" die
Datei "managementnacht.htm" vom Rechner "62.214.12.13" angefordert und
vollständig übertragen. Übertragen wurden 2476 Bytes. Der Verwendete User
Agent ist vermutlich neuer als Netscape Navigator oder Netscape Communicator
(Netscape 4 und 4.7), da er zum Microsoft Internet Explorer 6 kompatibel,
d.h. vergleichbar ist. Das Betriebssystem des Besuchers ist Windows 98, der
Browser vermutlich Opera 3 oder 4 oder ein Download Agent.

Apache Logfiles
http://httpd.apache.org/docs/logs.html#accesslog
Browser Archive
http://browsers.evolt.org/index.cfm/dir/opera/

> Content-Seiten Abrufe
Ich habe TV- oder Radiospot oder andere Werbemaßnahmen veranstaltet und sehe
einen vertärkten Abruf der Content Seiten, sagen wir innerhalb von 36
Stunden. Ich gehe davon aus, das niemand mehr länger als drei Tage zurück
eine Webseite besucht, weil er a) was im Radio gehört, im b) Fernsehen
gesehen oder c) Post oder Postwurfsendung erhalten hat.

> Das bringt uns zum System der Webbugs -

Meinst "Du Grafik ruft CGI Hallo Hallo" ?
http://www.bluemerlin-security.de/Bericht_WebBugs.php3


> damit lässt sich per SessionCookie
> (und absteigende Usererkennung bis hin zu JS & Hashcode über
Browser/OS/IP)
> zumindest die Anzahl der PageViews recht gut annähern.

Das würde ich gern genauer wissen.

> > - Wo Fehler auftraten,
> Jo! Die Error-Codes der Logfiles auszuwerten ist hoffentlich eine
> Pflichtübung für jeden WebAdmin.

Fehler nicht auf Errorcodes begrenzt, dann sollte es ja keine Browserweichen
mehr geben.

> Mittels Webbugs hat man zumindest einen Näherungswert.

eben

> Logfileanalyse und die daraus gewonnen Daten sind auf jeden Fall wichtig
für
> den Online-Markt und werde auch weiter an Bedeutung gewinnen.

Woraus schließt Du das?

> Werbe(miß)erfolges sind zumindest besser wie in den klassischen Medien
> Print,TV,..

Ist der gestiegene Umsatz eines Produktes nicht ein besseres Maß als eine
besuchte Webseite? Öhm, am Kopf kratz kratz.

Ich würde mich über viel Feedback sehr freuen.

MfG
Jens

Dominik Boecker

unread,
Jun 5, 2002, 7:48:08 PM6/5/02
to
Jens Peter <jens....@foni.net> wrote:

> Jeder Wert kann verfälscht sein, das sehe ich anders.

Warum?

> UserAgent:
> Auch hier bekommen wir meist eine Kennung, auch wenn dies nnicht dier
> Kennung des jeweiligen User Agent sein muß.

Ja ach.

> Wenn der Opera User mit Mozilla 5 als Kennung durch die Gegend surft, dann
> folgere ich, das er gerne die Seiten mit "Mozilla Augen" sehen möchte.

Nein. Es sagt nur, daß er sich als Mozilla identifiziert. Nicht mehr,
nicht weniger. Die Folgerung ist reine Spekulation.

> 62.214.12.13 - - [20/Nov/2001:04:04:48 +0100] "GET /managementnacht.htm
> HTTP/1.1" 200 2476 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows 98;
> QXW03363)"
> Ich versuch mal diese Logfile Zeile auszuwerten.
>
> Am "20. November 2002" wurde um "4 Uhr Nachts deutscher Winterzeit" die
> Datei "managementnacht.htm" vom Rechner "62.214.12.13" angefordert

Gut, daß Du das nach Rechner "" geschrieben hast.

> und vollständig übertragen. Übertragen wurden 2476 Bytes.

Das ja.

> Der Verwendete User Agent ist vermutlich

^^^^^^^^^^^
Spekulation.

> neuer als Netscape Navigator oder Netscape Communicator (Netscape 4 und
> 4.7), da er zum Microsoft Internet Explorer 6 kompatibel, d.h.
> vergleichbar ist.

Bitte? Netscape 4/4.7 kopatibel zum IE 6 und deswegen vergleichbar?
Welche Schlüsse wrdest Du denn daraus ziehen?

> Das Betriebssystem des Besuchers ist Windows 98,

Nein.

> der Browser vermutlich Opera 3 oder 4 oder ein Download Agent.

Warum?

Mit welchem Browser war ich denn bis eben unterwegs?

| Mozilla 4.0 (compatible; MSIE 6.5a8; Windows 5.3a1; Mozilla; Opera;)

*Viel Spaß*! <veg>

> > Mittels Webbugs hat man zumindest einen Näherungswert.

^
<ins>leicht fälschbaren</ins> und unsicher erhobenen

> eben

Und? Hast Du die Seite gelesen, die im OP erwähnt wird?

> Woraus schließt Du das?

Das hat ihm sein Voodoo-Meister erklärt. ;)

Dominik
--
Dominik Boecker schrieb:
> Wer das Posting ganz liest, ist im Vorteil...
Was meinst Du mit Posting ganz ...?
roland kuehne im September in d.r.o.

Jens Peter

unread,
Jun 5, 2002, 8:12:40 PM6/5/02
to

"Dominik Boecker"

> > Jeder Wert kann verfälscht sein, das sehe ich anders.
> Warum?
Natürlich, kann er verfäscht sein, halte ich aber nicht für entscheidend.

> Gut, daß Du das nach Rechner "" geschrieben hast.

?

> Bitte? Netscape 4/4.7 kopatibel zum IE 6 und deswegen vergleichbar?
> Welche Schlüsse wrdest Du denn daraus ziehen?

CSS 1 teilweise anwendbar, Betriebssystem Windows 98,

> Nein.
Warum nein?

> > der Browser vermutlich Opera 3 oder 4 oder ein Download Agent.
> Warum?

Warum nicht, Schlussfolgerung.

> Mit welchem Browser war ich denn bis eben unterwegs?

mit einem Browser mit manipulierten http Header?

> <veg>
?

> OP
?

> Das hat ihm sein Voodoo-Meister erklärt. ;)

Ja dann.


CU
Jens

Simon Oberhammer

unread,
Jun 6, 2002, 4:51:42 AM6/6/02
to
Hi Jens,

> danke für Deinen Beitrag den ich sehr interssant finde.

..ich deinen hier auch, aber ich bin mir nicht immer ganz
sicher worauf du hinauswolltest... Aber lies mal:

> > ... Jeder Wert
> > den ich im Log festhalten kann, könnte verfälscht sein & ist es
> > meistens auch (Referrer, IP, UserAgent,...)
> Jeder Wert kann verfälscht sein, das sehe ich anders.
> (Irrtümer und schlechte Tage vorbehalten). Auch ein
> verfälschter Wert ist ein Wert, auch ein nicht vorhandener
> Wert ein meßbareres Ergebnis. Ich versuche das greifbarer zu machen:

"jeder wert" war natürlich schwachsinn. Timestamp, http-status-code
(also infos vom server selbst) sind schon richtig. Aber bei
Allen anderen besteht zumindest die recht große gefahr, dass
Etwas verfälscht wurde - und wir haben ja auch null möglichkeit
Nachzuvollziehen welcher wert verfälscht/richtig ist.

> Referrer:
> Irgend einen Referrer hat man oder hat man nicht. Für den
> Fall das wir Referrer haben, woher können Referrer stammen?
> Andere Webseite oder Proxy oder Server. Richtig?

Der Referrer - wenn er übertragen wird - stimmt eigentlich
Meistens (Referrer müsste man ja bewußt fälschen);
das dumme ist nur, dass er laut HTTP RFC ein
optionales Feld ist - IE/NS übertragen Ihne relativ brav,
wenn auch - wie könnte es anders sein - mit Bugs.

> IP:
> Wir haben eine IP Adresse. Die haben wir doch immer, ja? Es
> ist mir zunächst egal ob die zu einem Server oder zu einer
> Workstation führt.

Da stimme ich dir zu - irgendeine IP bekommt man sicher. Die
bringt einem nur noch nichts für eine besser Logfile-Analyse,
die meist auf Clickstream-Analysen basieren; und dafür
müssten wir irgendwie die einzelnen User identifizieren, wofür
sich die IP anbieten würde - wäre da halt nicht das Problem,
dass sie sowohl für einen User während einer Session wechseln
kann (AOL), als auch oft für viele User die gleiche ist (Proxies).

> UserAgent:
> Auch hier bekommen wir meist eine Kennung, auch wenn dies
> nnicht dier Kennung des jeweiligen User Agent sein muß. Wenn
> der Opera User mit Mozilla 5 als Kennung durch die Gegend
> surft, dann folgere ich, das er gerne die Seiten mit "Mozilla
> Augen" sehen möchte.

Zustimm. So hab ich das noch nicht gesehen :)

> > Kaum jemand der unter Linux Konqueror verwendet lässt den Konqueror
> > auch diese UA
> > Kennung mitschicken, da man oft von Browserweichen (wäh)
> > ins Nirvana geschickt wird, etc.
> Da gehört mal den Entwicklern von nicht Mainstream Browsern
> gesagt, daß sie im Browser einen schnellen Wechseldialog der
> Kennung anbieten oder die Kennung "on demand" nur für die
> Verbindung mit einer bestimmten Webseite anbieten und danach
> wieder in die Standardkenung gehen.
> Das wäre ein unheimlicher Gewinn für das Internet.
> Nicht-Mainstreambrowser würden eine stärkere Verbreitung
> finden, da sie mehr in Browserstatistiken auftauchen würden.
> Microsoft und Netscape würden unter Druck geraten und
> Standard konformere Browser entwickeln. Webautoren würden
> aufhören hirnlose Browserweichen zu schreiben (Diese Seite
> kann nur...) und ein Pluralismus der Betreibssysteme würde
> innovativere Software liefern. O Du schöner Zukunftstraum.

??? Du schlägst vor, dass Microsoft/Netscape schnelle
UA-Kennungswechsel einbauen, damit sie Marktanteil verlieren.
den vorschlag kannst ja mal an MS formulieren :)

> > (kein Proxy) ist verpflichtet diese Infos mitzuschicken und
> Firewalls
> > verstecken sowas ja bewußt...
> siehe IP oben
>
> Heutigen AOL Usern kann man alles verkaufen, ja moment
> vielleicht sollte ich die zu meiner bevorzugten Zielgruppe
> machen. Interessanter Gedanke und ein guter Grund eine
> Geschäftpartnerschaft mit AOL einzugehen. Sollte ich mal was
> für Senioren oder die +40 Generation verkaufen wollen, werde
> ich das eventuell tun.

Jo. Gutes Kommentar, aber wie soll ich das in diesem
Zusammenhang verstehen?

> > IP?
> Sorry, Gemeint ist natürlich Internet Protocoll Adresse z.B.
> 62.214.12.13

Das hab ich schon verstanden; aber in dem Satz
"> - Wieviel Datenmenge and diese IP ging," hat
mich IP gestört - weil das heutzutage nicht mehr
sehr oft tatsächlich die IP des Users ist.

> 62.214.12.13 - - [20/Nov/2001:04:04:48 +0100] "GET
> /managementnacht.htm HTTP/1.1" 200 2476 "-" "Mozilla/4.0
> (compatible; MSIE 6.0; Windows 98; QXW03363)" Ich versuch mal
> diese Logfile Zeile auszuwerten.
>
> Am "20. November 2002" wurde um "4 Uhr Nachts deutscher
> Winterzeit" die Datei "managementnacht.htm" vom Rechner
> "62.214.12.13" angefordert und vollständig übertragen.
> Übertragen wurden 2476 Bytes. Der Verwendete User Agent ist
> vermutlich neuer als Netscape Navigator oder Netscape
> Communicator (Netscape 4 und 4.7), da er zum Microsoft
> Internet Explorer 6 kompatibel, d.h. vergleichbar ist. Das
> Betriebssystem des Besuchers ist Windows 98, der Browser
> vermutlich Opera 3 oder 4 oder ein Download Agent.

Jo. Ich hab beruflich viel mit Logs und Log-Analyse zu tun.
Nix neues an der Front :)

> > Das bringt uns zum System der Webbugs -
> Meinst "Du Grafik ruft CGI Hallo Hallo" ?
> http://www.bluemerlin-> security.de/Bericht_WebBugs.php3

Genau das meine ich!

> damit lässt sich per
> SessionCookie
> > (und absteigende Usererkennung bis hin zu JS & Hashcode über
> Browser/OS/IP)
> > zumindest die Anzahl der PageViews recht gut annähern.
> Das würde ich gern genauer wissen.

Eine kurze Zusammenfassung gibt's hier:
http://www.ivwonline.de/news/pm_2001-04-30.php
Ist echt ein cooles Leistungsfähiges System, mit ordentlicher
verteilter Strategie.

> > Logfileanalyse und die daraus gewonnen Daten sind auf jeden Fall
> > wichtig
> > für den Online-Markt und werde auch weiter an Bedeutung gewinnen.
> Woraus schließt Du das?

Weil die Techniken für die Ermittlung der Zugriffsdaten besser
werden und mittlerweile auch einige Projekte am laufen sind,
die diese anonymen Userdaten demographisch mit Umfrage-Daten
der Website-Besucher abgleichen. Das geht in eine
interessante richtung. Auch die Identifizierung von
UniqueVisitors (im Sinne des Wortes) und von WebSite-übergreifender
Erfassung des Userverhaltens wird realistisch.

> > Werbe(miß)erfolges sind zumindest besser wie in den
> klassischen Medien
> > Print,TV,..
> Ist der gestiegene Umsatz eines Produktes nicht ein besseres
> Maß als eine besuchte Webseite? Öhm, am Kopf kratz kratz.

Schon war. aber es lassen sich auf für die werbe-treibenden
leichter aussagen treffen wie
- kampagne X wurde von Y Users gesehen & Z mal angeklickt
- X User sind über die kampagne auf unsere seite gekommen
...

gruß
simon

Dominik Boecker

unread,
Jun 6, 2002, 10:54:01 AM6/6/02
to
Jens Peter <jens....@foni.net> wrote:

> "Dominik Boecker"
> > > Jeder Wert kann verfälscht sein, das sehe ich anders.
> > Warum?
> Natürlich, kann er verfäscht sein, halte ich aber nicht für entscheidend.

Du sammelst Daten, weißt, daß diese verfälscht sein können und willst
daraus trotzdem Deine Schlüsse ziehen? Diese Daten sind Deine Grundlage
und Du hälst die trotzdem "nicht für entscheidend."?

Die Daten könntest Du genauso gut auch auswürfeln und dann daraus Deine
Schlüsse ziehen.

(Man kann zB. aus dem User-Agent auch falsche Schlüsse ziehen, vgl: den
Thread, der mit <news: 1fd9riv.1hl66hqz1zji8N%ron...@wichern-web.de> in
<news:de.comp.sys.mac.internet> anfängt. Dort wurde "optimiert" und alle
anderen werden ausgeschlossen...)

> > Gut, daß Du das nach Rechner "" geschrieben hast.
> ?

Es kann auch der Rechner "62.214.12.17" sein, der es angefordert hat und
"62.214.12.13" lediglich als Proxy gebraucht.

> > Bitte? Netscape 4/4.7 kopatibel zum IE 6 und deswegen vergleichbar?
> > Welche Schlüsse wrdest Du denn daraus ziehen?
> CSS 1 teilweise anwendbar, Betriebssystem Windows 98,

Weder noch. Er *gibt vor* Windows 98 zu sein und die CSS Unterstützung
ist immer optional.

| > > Das Betriebssystem des Besuchers ist Windows 98,
> > Nein.
> Warum nein?

Weil's beliebig fälschbar und diese Aussage deswegen unsicher ist.

> > > der Browser vermutlich Opera 3 oder 4 oder ein Download Agent.
> > Warum?
> Warum nicht, Schlussfolgerung.

Auf Grundlage von unsicher erhobenen Daten? Mutiger Schluß.

> > Mit welchem Browser war ich denn bis eben unterwegs?
> mit einem Browser mit manipulierten http Header?

Ach? Und welcher war es?

> > OP
> ?

Das Ausgangsposting: <1fct1bw.1ac...@ID-42033.user.dfncis.de>

Dominik

Jens Peter

unread,
Jun 6, 2002, 2:45:55 PM6/6/02
to

> Du sammelst Daten, weißt, daß diese verfälscht sein können und willst
> daraus trotzdem Deine Schlüsse ziehen? Diese Daten sind Deine Grundlage
> und Du hälst die trotzdem "nicht für entscheidend."?
Genau das gleiche machst Du auf deiner Seite, deines OP (Das
Ausgangsposting): news:1fct1bw.1ac...@ID-42033.user.dfncis.de

Wir haben zwei Meinungen und das ist gut so.

MfG

Jens

Dominik Boecker

unread,
Jun 6, 2002, 3:53:10 PM6/6/02
to
Jens Peter <jens....@foni.net> wrote:

> > Du sammelst Daten, weißt, daß diese verfälscht sein können und willst
> > daraus trotzdem Deine Schlüsse ziehen? Diese Daten sind Deine Grundlage
> > und Du hälst die trotzdem "nicht für entscheidend."?
> Genau das gleiche machst Du auf deiner Seite,

Hast Du die Zeit und die Lust die Passagen zu zitieren, wo ich Schlüsse
aus gewonnenen Daten ziehe?

> Wir haben zwei Meinungen und das ist gut so.

Offensichtlich und Ack.

Dominik
--

Jens Peter

unread,
Jun 6, 2002, 4:52:16 PM6/6/02
to

"Dominik Boecker" <dominik...@gmx.de> schrieb im Newsbeitrag
news:1fddjvk.9y...@ID-42033.user.dfncis.de...

> Hast Du die Zeit und die Lust die Passagen zu zitieren,
Nein

> wo ich Schlüsse aus gewonnenen Daten ziehe?

<BLOCKQUOTE cite="http://www.dodabo.de/netz/statistik.html">
Strategieplanung

Es kommt hier auf die Qualität (und die damit oben angesprochenen Probleme)
der erhobenen Daten an.

Darüber hinaus stellt sich auch die Frage, welche Strategien man aus den
gewonnenen Statistiken entwickeln kann. Für eine profitorientierte Seite
wäre es wesentlich interessanter zu erfahren, ob mit einem bestimmten
Browser eine bestimmte Kaufkraft korreliert. Dabei gibt es aber wieder
einige unbekannte Variablen.
</BLOCKQUOTE>

Wenn Du diese Aussagen nicht aus gewonnen Daten ableitest, tja dann träume
schön.


Gute Nacht.
Jens

Dominik Boecker

unread,
Jun 6, 2002, 5:18:38 PM6/6/02
to
Jens Peter <jens....@foni.net> wrote:

> "Dominik Boecker" <dominik...@gmx.de> schrieb im Newsbeitrag
> news:1fddjvk.9y...@ID-42033.user.dfncis.de...

> > wo ich Schlüsse aus gewonnenen Daten ziehe?
>
> <BLOCKQUOTE cite="http://www.dodabo.de/netz/statistik.html">
> Strategieplanung
>
> Es kommt hier auf die Qualität (und die damit oben angesprochenen Probleme)
> der erhobenen Daten an.

Oben beschreibe ich, warum die Daten zwangsläufig ungenau sind...

> Darüber hinaus stellt sich auch die Frage, welche Strategien man aus den
> gewonnenen Statistiken entwickeln kann. Für eine profitorientierte Seite
> wäre es wesentlich interessanter zu erfahren, ob mit einem bestimmten
> Browser eine bestimmte Kaufkraft korreliert. Dabei gibt es aber wieder
> einige unbekannte Variablen.
> </BLOCKQUOTE>

Ich schreibe, daß man vielleicht eine Korrelation zu einzelnen
(möglicheriwese unrichtig erhobenen Daten) wissen *möchte*, diese
zusätzlich noch unbekannte Vatiablen hat (und darüberhinaus) dem Log
nicht zu entnehmen ist. Das ist kein Schluß von einem Datum auf eine
Strategie. Später auf der Seite steht noch, warum %-Sätze der Browser
gerade *nicht* dazu geeignet sind.

> Wenn Du diese Aussagen nicht aus gewonnen Daten ableitest, tja dann träume
> schön.

Und wo ist da ein logischer Schluß von einem Datum zu $etwas?

> Gute Nacht.

Offensichtlich.

Dominik
--

0 new messages