Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Benutzerstatistiken Mai 2012

4 views
Skip to first unread message

Thomas 'PointedEars' Lahn

unread,
Jun 3, 2012, 6:35:58 PM6/3/12
to
,-------------------------------------------------------------------.
: .-----------------------------------------------------------------. :
: : _____ : :
: : | PADD| ________ LCARS 24743 : :
: : :=====: 734 2326 4 4223 82472 670 (_LNG:DE_) (_SUCHEN_) : :
: : | 2374| 375 134318 3 95361 4231237 423 (_ZURÜCK_) (____VOR_) : :
: : | '.____________________ _______ __ _______________ __ : :
: : `.__________________________||_______||__||_______________||__| : :
: : __________________________ _______ __ _______________ __ : :
: : .' ____________________|'''''''''|__||_______________||__| : :
: : | .' : :
: : | | AN: Lt. Cmdr. Thomas Lahn : :
: : | | STERNZEIT: 201206.01 : :
: : | HDR| BETRIFFT: Statistik : :
: : :=====: : :
: : | | Sie werden hiermit gebeten und dazu aufgefordert, : :
: : | | ab sofort das Kommando über die de.rec.sf.startrek- : :
: : | | Statistik von Cmdr. Andreas Kohlbach, Statistik- : :
: : |NACHR| offizier USS Montreal NCC-92109, zu übernehmen. : :
: : :=====: : :
: : | SIG| Konteradm. Jean-Luc Picard, : :
: : | | Sternenflottenkommando : :
: : | | _____________________ : :
: : |_____| |_SIGNATUR_ÜBERPRÜFEN_||) : :
: : : :
: `-----------------------------------------------------------------' :
: :
: .-----------------------------------------------------------------. :
: : |#| |*| | | |v^VVv*vvvvv^^^^^^*.vvvvv^^^VVVVVV******^^^VVVVVv| : :
: `-----------------------------------------------------------------' :
: :
:=====================================================================:
: :
: ,-----------------------------------. :
: : : :
: : .-..------------------. .-. : :
: : : ::##################: 674 : : : :
: : '-''------------------' '-' : :
: : .-..------------------. .-. : :
: : : ::******************: 004 : : : :
: : '-''------------------' '-' : :
: : : :
: `-----------------------------------' :
: :
`-------------------------------------------------------------------'

Ich löse Sie ab, Sir. *handschüttel*


Ab sofort darf ich also die monatliche Statistik hierzugruppe erstellen.
Ich danke Andreas für seine bisherige Arbeit und wünsche ihm langes Leben
und Erfolg für seine zukünftigen Aufgaben ausserhalb der Sternenflotte.
Durch die Fortführung seiner Arbeit in seinem Sinne werde ich das in mich
gesetzte Vertrauen rechtfertigen.
___

Die neue Statistik wird durch ein Rewrite des vorhandenen Statistik-Skripts
generiert. Deshalb gibt es folgende Verbesserungen:

Für Leser
----------

- Der Text ist jetzt passend zur Newsgroup deutschsprachig und alle Zahlen
sind gemäss der deutschsprachigen Einstellungen (für die Schweiz)
formatiert. (Die Übersetzung wird über gettext-kompatible
Internationalisierungsfunktionen erreicht, d. h. der gepostete Text
und allfällige Fehlermeldungen werden anhand einer mitgelieferten
Sprachdatei für Deutsch (de.po) automagisch aus dem Englischen übersetzt.)
[1]

- Die Zusammenfassung ist jetzt besser lesbar, weil die Daten soweit wie
sinnvoll möglich aneinander ausgerichtet sind.

- Es werden die Absendedaten (Received-Headerfelder oder Date-Headerfeld)
berücksichtigt. Zuvor wurden Postings entsprechend ihres Eingangsdatums
auf dem privaten Newsserver berücksichtigt. Das führte möglicherweise
dazu, dass einige Postings nicht berücksichtigt wurden.

- Es werden alle Postings berücksichtigt, die vom ersten Tag des Vormonats
00:00:00.000 UTC bis zum letzten Tag des Vormonats 24:00:00.000 UTC
gepostet wurden. Somit spielt die Zeitzone des Posters oder Servers
keine Rolle mehr, und es werden auch bei Vormonaten mit mehr als 30 Tagen
alle Postings des Vormonats berücksichtigt (zuvor waren dies nur die
Postings der letzten 30 Tage vor der jeweiligen Server-Uhrzeit).

- Eine fehlende Zeitzonenangabe wird wie UTC (+0000) gewertet. Damit
entfällt der fehlerhafte leere Eintrag in der Zeitzonenstatistik.

- Diverse Feinkorrekturen, wie etwa des Fehlers, dass eine Top-20-Statistik
die Überschrift "Top 17" hatte, wenn es dafür nur 17 Einträge gab.

Für Entwickler
---------------

- Viele – so nicht benötigte – globale Variablen wurden entfernt; der Aufbau
ist jetzt wesentlich modularer.

- Es werden soweit möglich (und für mich ersichtlich) die gut getesteten
Perl-Module von CPAN verwendet, insbesondere Mail::Message, DateTime und
DateTime::Format::Mail. Das vermeidet Stolpersteine und Bugs, die mit
dem vorherigen Eigenbau einhergingen, und erleichtert auch vieles. Zum
Beispiel findet mit Mail::Message->study('…') die zuvor problematische
MIME-Decodierung nach UTF-8 nun transparent statt. (Kleiner ist das
Script dadurch jedoch bisher nicht geworden, was aber hauptsächlich am
durchgängigen Pretty Printing und an der i18n liegt.)

- Es gibt einen Debug-Modus (int-Konstante DEBUG), der eine entsprechende
Sub (`dmsg') aufruft.

Das entsprechende Perl-Skript werde ich so bald als möglich per WebSVN unter
der GNU GPLv3 veröffentlichen.
___

Ich verwende nicht Andreas' Filterregeln, da ich leafnode(8) derzeit nur für
die drss-Statistik verwende, und wir bei der Übergabe auf einen Austausch
der Regeln verzichtet haben. Grundsätzlich werden alle Postings auf dem
Newsserver news.arcor.de (mein NetNews-Anbieter) berücksichtigt.

Nachträglich ausgeschlossen von der Statistik werden jedoch Postings, die
technisch fehlerhaft sind. Dies gilt auch für Postings, deren Headerfelder
nicht RFC 5322 entsprechen, die also z. B. keinen (gültigen) Absender
enthalten. Wer also grundsätzlich in der Statistik auftauchen möchte, möge
bitte <http://www.gerlo.de/falsche-email-adressen.html> beherzigen.

Ausserdem werden Postings von usenetweit anerkannten Trollen und anderen,
nicht zweifelsfrei als potentiell intelligent identifizierten Lebensformen
ausgeschlossen, denn mit dieser Statistik soll diesen keine Erwähnung zuteil
und keine Plattform geboten werden. (Ich gehe davon aus, dass das auch
schon vorher so war.)

Hierzu werde ich, falls nötig, für leafnode(8) ein separates Killfile
pflegen. Die Filterung findet also in jedem Fall schon vor dem Skript
statt.

"Ende der Ansprache, an die Arbeit."[tm]
____

[1] <http://search.cpan.org/~guido/
libintl-perl-1.20/lib/Locale/TextDomain.pm>

============================================================================
Analyse der Artikel in de.rec.sf.startrek
============================================================================
(erstellt mit einem Skript von Thomas 'PointedEars' Lahn, basierend auf
der Arbeit von Garry Knight und anderen)


Berücksichtigte Postings: 210 über 31 Tage
Ältester Artikel: Di., 2012-05-01T00:43:03 UTC
Neuester Artikel: Do., 2012-05-31T23:01:01 UTC
Originalartikel: 10; Antworten: 200
Postings insgesamt: 724314 Bytes (707 KiB) (0.69 MiB)
Durchschnittlich 6 Artikel je Tag, 0.02 MiB je Tag, 3449 Bytes je Artikel
Header insgesamt: 345 KiB; Bodys: 361 KiB
Body-Text - zitiert: 175 KiB; original: 176 KiB = 50.23%; sigs: 9 KiB
Poster insgesamt: 17, durchschnittlich 42606 Bytes je Poster
Threads insgesamt: 13, durchschnittlich 55716 Bytes je Thread
Benutzerprogramme insgesamt: 25

============================================================================
20 häufigste Poster nach Anzahl der Artikel
============================================================================
1: Joerg Sub <jo...@spambog.de>................................... : 47
2: Thomas Koller <tko...@gmx.at>................................. : 32
3: René Schuster <rene+...@schuster.priv.at>................... : 28
4: Thomas 'PointedEars' Lahn <Point...@web.de>................. : 25
5: Casey Rosebud <casey....@arcor.de>......................... : 21
6: Gerald Gruner <gera...@yahoo.de>............................. : 14
7: Andreas Kohlbach <april12....@spamgourmet.com>............ : 11
8: Mike Grantz <beat...@stoiseland.de>.......................... : 8
9: Marko Renner <marko....@gmx.de>............................. : 7
10: Ralf Bochon <usenet...@bochon.de>........................... : 6
11: Ruediger Lahl <ruedig...@gmx.de>........................... : 3
12: Thomas Grund <tom....@gmx.de>................................ : 3
13: Hendrik Seffler <f...@filmateleven.de>.......................... : 1
14: Andreas Kohlbach <may12.8...@spamgourmet.com>.............. : 1
15: M G Berberich <berb...@forwiss.uni-passau.de>................. : 1
16: Andy Angerer <and...@angerer-bodenlos.de>..................... : 1
17: Thomas Heier <Th...@thomas-heier.de>........................... : 1

============================================================================
20 häufigste Poster nach Artikelgrösse in KiB
============================================================================
1: Joerg Sub <jo...@spambog.de>................................... : 162
2: Thomas Koller <tko...@gmx.at>................................. : 138
3: Thomas 'PointedEars' Lahn <Point...@web.de>................. : 121
4: René Schuster <rene+...@schuster.priv.at>................... : 82
5: Casey Rosebud <casey....@arcor.de>......................... : 42
6: Andreas Kohlbach <april12....@spamgourmet.com>............ : 42
7: Gerald Gruner <gera...@yahoo.de>............................. : 33
8: Marko Renner <marko....@gmx.de>............................. : 25
9: Mike Grantz <beat...@stoiseland.de>.......................... : 17
10: Ralf Bochon <usenet...@bochon.de>........................... : 12
11: Hendrik Seffler <f...@filmateleven.de>.......................... : 11
12: Thomas Grund <tom....@gmx.de>................................ : 6
13: Ruediger Lahl <ruedig...@gmx.de>........................... : 5
14: M G Berberich <berb...@forwiss.uni-passau.de>................. : 2
15: Andreas Kohlbach <may12.8...@spamgourmet.com>.............. : 1
16: Andy Angerer <and...@angerer-bodenlos.de>..................... : 1
17: Thomas Heier <Th...@thomas-heier.de>........................... : 1

============================================================================
20 häufigste Antwortende nach Originaltext (> 5 Postings)
============================================================================
1: Ralf Bochon <usenet...@bochon.de>........................... : 74.16%
2: Andreas Kohlbach <april12....@spamgourmet.com>............ : 70.90%
3: Casey Rosebud <casey....@arcor.de>......................... : 65.09%
4: Mike Grantz <beat...@stoiseland.de>.......................... : 61.48%
5: Gerald Gruner <gera...@yahoo.de>............................. : 60.02%
6: Marko Renner <marko....@gmx.de>............................. : 47.93%
7: Thomas 'PointedEars' Lahn <Point...@web.de>................. : 47.17%
8: Joerg Sub <jo...@spambog.de>................................... : 46.75%
9: René Schuster <rene+...@schuster.priv.at>................... : 42.33%
10: Thomas Koller <tko...@gmx.at>................................. : 41.22%

============================================================================
20 seltenste Antwortende nach Originaltext (> 5 Postings)
============================================================================
1: Thomas Koller <tko...@gmx.at>................................. : 41.22%
2: René Schuster <rene+...@schuster.priv.at>................... : 42.33%
3: Joerg Sub <jo...@spambog.de>................................... : 46.75%
4: Thomas 'PointedEars' Lahn <Point...@web.de>................. : 47.17%
5: Marko Renner <marko....@gmx.de>............................. : 47.93%
6: Gerald Gruner <gera...@yahoo.de>............................. : 60.02%
7: Mike Grantz <beat...@stoiseland.de>.......................... : 61.48%
8: Casey Rosebud <casey....@arcor.de>......................... : 65.09%
9: Andreas Kohlbach <april12....@spamgourmet.com>............ : 70.90%
10: Ralf Bochon <usenet...@bochon.de>........................... : 74.16%

============================================================================
Top 20 der Threads nach Anzahl der Artikel
============================================================================
1: Planet Erde - der einzige Planet mit Leben?.................... : 142
2: [INFO] de.rec.sf.startrek - Linkliste <2012-03-01>............. : 15
3: This means war................................................. : 14
4: Mond stürzt auf Planet......................................... : 12
5: "Star Trek - Online", spielt das hier jemand ? ^^.............. : 11
6: In Echtzeit beobachtet......................................... : 4
7: Monatliche Statistiken......................................... : 4
8: Enterprise über New York....................................... : 3
9: 1.000.000.000.000$ Baukosten................................... : 1
10: <2009-04-24> Hinweise fuer Einsteiger.......................... : 1
11: 26.5.: Happy Birthday Enterprise auf ZDF Neo (24h)............. : 1
12: Benutzer Statistiken April 2012................................ : 1
13: [FYI] Weil es einen Idealismus beinhaltet...................... : 1

============================================================================
Top 20 der Threads nach Grösse in KiB
============================================================================
1: Planet Erde - der einzige Planet mit Leben?.................... : 539
2: Mond stürzt auf Planet......................................... : 33
3: This means war................................................. : 32
4: [INFO] de.rec.sf.startrek - Linkliste <2012-03-01>............. : 32
5: "Star Trek - Online", spielt das hier jemand ? ^^.............. : 18
6: Benutzer Statistiken April 2012................................ : 13
7: <2009-04-24> Hinweise fuer Einsteiger.......................... : 11
8: Monatliche Statistiken......................................... : 8
9: Enterprise über New York....................................... : 6
10: In Echtzeit beobachtet......................................... : 6
11: [FYI] Weil es einen Idealismus beinhaltet...................... : 1
12: 1.000.000.000.000$ Baukosten................................... : 1
13: 26.5.: Happy Birthday Enterprise auf ZDF Neo (24h)............. : 1

============================================================================
10 häufigste Gruppen, in die gecrosspostet wurde
============================================================================
1: de.sci.astronomie.............................................. : 1
2: de.rec.sf.babylon5.misc........................................ : 1
3: de.rec.tv.serien............................................... : 1

============================================================================
10 häufigste Benutzerprogramme je Poster
============================================================================
1: Mozilla........................................................ : 6
2: Gnus........................................................... : 2
3: unbekannt...................................................... : 2
4: KNode.......................................................... : 2
5: MacSOUP........................................................ : 1
6: NewsTap........................................................ : 1
7: tin............................................................ : 1
8: 40tude_Dialog.................................................. : 1
9: slrn........................................................... : 1
10: Pan............................................................ : 0

============================================================================
10 häufigste Benutzerprogramme nach der Anzahl Postings
============================================================================
1: Mozilla................................................... : 99 (47%)
2: tin....................................................... : 32 (15%)
3: KNode..................................................... : 26 (12%)
4: Opera Mail................................................ : 16 ( 8%)
5: 40tude_Dialog............................................. : 14 ( 7%)
6: Gnus...................................................... : 12 ( 6%)
7: unbekannt................................................. : 7 ( 3%)
8: NewsTap................................................... : 2 ( 1%)
9: MacSOUP................................................... : 1 ( 0%)
10: slrn...................................................... : 1 ( 0%)

============================================================================
10 häufigste Zeitzonen
============================================================================
1: +0200.......................................................... : 138
2: +0000.......................................................... : 34
3: +0300.......................................................... : 26
4: -0400.......................................................... : 12

============================================================================

--
\\//,
(\PointedEars/)

Thomas 'PointedEars' Lahn

unread,
Jun 7, 2012, 10:36:44 AM6/7/12
to
Thomas 'PointedEars' Lahn postete zur Sternzeit 201206.04 00:35 UTC+2:

> [<news:2238317.x...@PointedEars.de>]

Die Statistik ist dieses Mal aufgrund des Vorworts mit 311 Zeilen länger
als 200 Zeilen und wird daher möglicherweise bei einigen automagisch
herausgefiltert.

--
\\//,
(\PointedEars/)

René Schuster

unread,
Jun 7, 2012, 3:57:10 PM6/7/12
to
On 2012-06-04 01:35, Thomas 'PointedEars' Lahn wrote:

> - Es werden die Absendedaten (Received-Headerfelder oder Date-Headerfeld)
> berücksichtigt. Zuvor wurden Postings entsprechend ihres Eingangsdatums
> auf dem privaten Newsserver berücksichtigt.

Die beste Erweiterung seit der Erfindung des Scripts. ;-)

> - Diverse Feinkorrekturen, wie etwa des Fehlers, dass eine Top-20-Statistik
> die Überschrift "Top 17" hatte, wenn es dafür nur 17 Einträge gab.

Das ist/war Feature, nicht Bug! Eine "Top 20" mit nur 17 Einträgen sieht
IMNSHO irgendwie komisch aus.

> Ich verwende nicht Andreas' Filterregeln,

Er hatte Filterregeln?

> Nachträglich ausgeschlossen von der Statistik werden jedoch Postings, die
> technisch fehlerhaft sind. Dies gilt auch für Postings, deren Headerfelder
> nicht RFC 5322 entsprechen, die also z. B. keinen (gültigen) Absender
> enthalten. Wer also grundsätzlich in der Statistik auftauchen möchte, möge
> bitte <http://www.gerlo.de/falsche-email-adressen.html> beherzigen.

Das ist Erstens POV und Zweitens völlig veraltet.

> Ausserdem werden Postings von usenetweit anerkannten Trollen und anderen,
> nicht zweifelsfrei als potentiell intelligent identifizierten Lebensformen
> ausgeschlossen,

Die da wären?

> denn mit dieser Statistik soll diesen keine Erwähnung zuteil und
> keine Plattform geboten werden. (Ich gehe davon aus, dass das auch
> schon vorher so war.)

Das bezweifle ich. Außerdem wäre das eine gravierende Verfälschung der
Statistik.

--
rs

Thomas 'PointedEars' Lahn

unread,
Jun 7, 2012, 5:23:16 PM6/7/12
to
René Schuster wrote:

> On 2012-06-04 01:35, Thomas 'PointedEars' Lahn wrote:
>> - Es werden die Absendedaten (Received-Headerfelder oder Date-Headerfeld)
>> berücksichtigt. Zuvor wurden Postings entsprechend ihres
>> Eingangsdatums auf dem privaten Newsserver berücksichtigt.
>
> Die beste Erweiterung seit der Erfindung des Scripts. ;-)

ACK.

>> - Diverse Feinkorrekturen, wie etwa des Fehlers, dass eine
>> Top-20-Statistik
>> die Überschrift "Top 17" hatte, wenn es dafür nur 17 Einträge gab.
>
> Das ist/war Feature, nicht Bug! Eine "Top 20" mit nur 17 Einträgen sieht
> IMNSHO irgendwie komisch aus.

Das sei Dir unbenommen. Sachlich fcshal war es trotzdem, deswegen hat diese
Praxis nun ein Ende. Man konnte dann zum Beispiel auch nicht erkennen, dass
es im fraglichen Zeitraum überhaupt nur 17 Threads gab, obwohl 20 zu
berücksichtigen waren.

>> Ich verwende nicht Andreas' Filterregeln,
>
> Er hatte Filterregeln?

Ja, anscheinend.

>> Nachträglich ausgeschlossen von der Statistik werden jedoch Postings, die
>> technisch fehlerhaft sind. Dies gilt auch für Postings, deren
>> Headerfelder nicht RFC 5322 entsprechen, die also z. B. keinen (gültigen)
>> Absender
>> enthalten. Wer also grundsätzlich in der Statistik auftauchen möchte,
>> möge bitte <http://www.gerlo.de/falsche-email-adressen.html> beherzigen.
>
> Das ist Erstens POV und Zweitens völlig veraltet.

IBTD.

>> Ausserdem werden Postings von usenetweit anerkannten Trollen und anderen,
>> nicht zweifelsfrei als potentiell intelligent identifizierten
>> Lebensformen ausgeschlossen,
>
> Die da wären?

Zum Beispiel Spammer.

>> denn mit dieser Statistik soll diesen keine Erwähnung zuteil und
>> keine Plattform geboten werden. (Ich gehe davon aus, dass das auch
>> schon vorher so war.)
>
> Das bezweifle ich.

Ich nicht.

> Außerdem wäre das eine gravierende Verfälschung der Statistik.

Dann passt es ja.

--
\\//,
(\PointedEars/)
Message has been deleted

René Schuster

unread,
Jun 8, 2012, 5:26:48 AM6/8/12
to
On 2012-06-08 00:23, Thomas 'PointedEars' Lahn wrote:

> René Schuster wrote:
>
>> On 2012-06-04 01:35, Thomas 'PointedEars' Lahn wrote:
>>> Ausserdem werden Postings von usenetweit anerkannten Trollen und anderen,
>>> nicht zweifelsfrei als potentiell intelligent identifizierten
>>> Lebensformen ausgeschlossen,
>>
>> Die da wären?
>
> Zum Beispiel Spammer.

Ach so, ACK. Aber davon solltest Du über Arcor ohnehin nichts
mitbekommen, oder?

--
rs

Thomas 'PointedEars' Lahn

unread,
Jun 8, 2012, 8:42:08 AM6/8/12
to
Ich sehe hier tatsächlich sehr wenig Spam, was akzeptabel[tm] ist.

--
\\//,
(\PointedEars/)
0 new messages