Jarosław Sokołowski <
ja...@lasek.waw.pl> wrote:
> Można metodę udoskonalić, choćby dodając analizę X-Newsreader, ale wiele
> się od tego w wynikach nie zmieni.
Dodałem, tu już nie ucinałem po pierwszym slashu, bo rozbieżność w
X-Newsreaderach jest mniejsza (do tego ignoruję User-Agent, gdy istnieje
X-Newsreader).
#v+
55.2% 5571 Mozilla
18.7% 1892 G2
8.1% 819 Microsoft Windows Live Mail 16.4.3528.331
4.1% 414 40tude_Dialog
2.9% 292 slrn
2.4% 242 Xnews
1.2% 122 Opera
0.9% 91 Groundhog
0.7% 68 Microsoft Outlook Express 6.00.2900.5931
0.6% 62 Microsoft Windows Live Mail 15.4.3555.308
0.6% 57 tin
0.5% 49 Microsoft Windows Mail 6.0.6002.18197
0.5% 47 Microsoft Outlook Express 6.00.3790.4657
0.4% 44 OE PowerTool 4.5.4
0.4% 43 NewsTap
0.3% 35 MyGate/
2.6.0.171 (
http://barin.com.ua/soft/mygate/)
0.3% 32 Forte Agent 1.93/32.576 English (American)
0.3% 30 HotdogEd
0.3% 28 PiaoHong.Usenet.Client.VIP:2.02
0.3% 28 Gnus
0.3% 26 Pan
0.2% 24 Claws Mail 3.17.8 (GTK+ 2.24.32; x86_64-suse-linux-gnu)
0.2% 19 Tosenevrati v4.05
0.1% 13 MesNews/1.08.06.00-gb
0.1% 11 Thunderbird
0.1% 9 PiaoHong.Usenet.Client.Free:2.02
0.1% 8 Microsoft Windows Mail 6.0.6001.18000
0.1% 7 Microsoft Outlook Express 6.00.2900.5512
0.1% 7 Forte Agent 4.2/32.1118
0.0% 3 Hamster
0.0% 2 Forte Agent 4.0/32.1071
0.0% 2 KNode
0.0% 1 Experimental
0.0% 1 Claws Mail 3.16.0 (GTK+ 2.24.32; x86_64-pc-linux-gnu)
0.0% 1 n4mail
0.0% 1 MicroPlanet-Gravity
#v-
> Drugi ważny wniosek jest taki, że bramka Google jest problemem dokuczliwym,
> ale wcale nie aż tak powszechnym. Tu (to będzie moja "uwaga do Adama")
> warto się przyjrzeć jak rozkłada się na grupy uzyskany wynik około 20%.
Ciekawy test, tylko ciężko sprawdzić, bo są grupy, na których jest tak
mały ruch, że fałszują wynik (np. w ostatnich 20 tysiącach postów na
pl.misc.samochody.garbusy 100% postów było z G2... czyli dwie sztuki).
Tzn. wynik jest technicznie poprawny, ale raczej nie o to nam chodzi.
Zrobiłem test dla ostatnich 50 tysięcy postów (od końca grudnia 2020)
i wyciąłem grupy, które przez ten czas zgromadziły poniżej 50 postów.
Kolejne pola oznaczają:
- procentowy udział postów z G2
- liczbę postów z G2
- całkowitą liczbę postów (w tym z G2)
- grupę
#v+
96.8% 60 62 pl.hum.poezja
89.0% 525 590 pl.rec.paralotnie
67.9% 850 1251 pl.sci.fizyka
56.1% 105 187 pl.sci.matematyka
39.6% 1856 4683 pl.pregierz
38.9% 42 108 pl.misc.kolej
38.8% 52 134 pl.comp.programming
30.4% 31 102 pl.rec.kuchnia
28.5% 79 277 pl.sci.inzynieria
27.5% 50 182 pl.sci.kosmos
20.8% 11 53 pl.rec.foto.cyfrowa
20.4% 32 157 pl.rec.rowery
19.3% 34 176 pl.soc.prawo.podatki
17.7% 83 470 pl.misc.militaria
15.1% 226 1500 pl.soc.polityka
14.6% 269 1847 pl.misc.budowanie
13.1% 33 252 pl.sci.psychologia
12.0% 9 75 pl.rec.foto
10.0% 21 211 pl.soc.religia
9.0% 180 1997 pl.misc.elektronika
8.5% 8 94 pl.rec.lotnictwo
7.9% 71 903 pl.biznes.banki
6.3% 4 63 pl.rec.gory
5.2% 22 420 pl.rec.fantastyka.sf-f
4.7% 8 171 pl.internet.mordplik
2.4% 55 2322 pl.soc.prawo
1.9% 10 523 pl.comp.os.ms-windows.winnt
1.3% 1 79 alt.pl.test
1.2% 7 600 pl.comp.os.linux
0.7% 4 535 pl.misc.telefonia.gsm
0.5% 4 747 pl.comp.pecet
#v-
> Gdy ja kiedyś robiłem podobne pomiary, wyszło, że kilka mocno aktywnych
> grup przekształciło się w fora webowe -- w zasadzie wszyscy siekają tam
> z gugla. W przypadku pozostałych jest to zjawisko marginalne, raczej
> malejące, niż nasilające się.
Na to wygląda.