Crosspost na pl.internet.pomoc
Osoba podpisana jako Freja Draco <
frr...@poczta.fm>
w artykule <news:5fcad1b3$0$555$
6578...@news.neostrada.pl> pisze:
> W dniu 2020-12-04 o 19:57, Andrzej P. Wozniak pisze:
>>
>> Ta grupa istnieje od maja 1998, więc ten wątek z całą pewnością nie
>> należy do najstarszych w archiwum. Stąd moje pytanie - dlaczego
>> akurat ten noworoczny wątek z 2004 roku? Szukałaś czegoś
>> szczególnego?
> W sumie to z założenia chciałam walnąć głupotę pt: odpowiedzmy na jakiś
> wątek sprzed dwóch dekad. Na wzmiankowanym serwerze posty zaczynają się
> od 2003 a wątki z początkiem od 2004.
Nieprawda. Na
news-archive.icm.edu.pl jest (prawie) kompletna grupa
pl.rec.fantastyka.sf-f od jej powstania 6 maja 1998 r., jest też jej
poprzedniczka pl.listserv.sf-f.
> Więc wybrałam pierwszy w miarę
> sensowny.
Więc pobrałaś nagłówki wiadomości w sposób niezbyt sensowny. Może stary
Thunderbird ma limit 512K wiadomości? Na serwerze jest ich ponad 660
tysięcy.
>> może zaczęły się na liście dyskusyjnej przed powstaniem grupy
>> pl.listserv.sf-f, a archiwum listy nie dysponuję. W 2000 r. to
>> zacząłem pisać z tego adresu, a zaczynałem 3 lata wcześniej. ObSF:
>> Czy to znaczy, że jestem legendą?
> W rzeczy samej :)
Kadzisz. Bardziej szczere były wyzwiska grupowej (nie tu) lamerki, że
używam nazwiska z książki telefonicznej.
> To chyba się muszę bardziej postarać. Kiedyś widziałam w necie spakowane
> archiwa różnych grup od najsamiejszego ich początku. Coś nawet swego
> czasu ściągałam.
Archiwa pl.* i alt.pl.* są na
archive.org:
https://archive.org/details/usenet-uat-pl
Można pobierać każdą grupę odzielnie lub torrenta z kompletem 337 grup.
Plusem jest to, że archiwa są kompletowane z kilku źródeł, w tym z list
dyskusyjnych istniejących przed powstaniem grup. Przy łączeniu usunięto
spam. Minusem jest fakt, że to jest jakaś wynalazkowa baza danych, do
której czytnik archiwów (tbrowser, tylko 64-bit) jest tu:
https://bitbucket.org/wolfpld/usenetarchive/downloads/
Tu możesz zobaczyć, jak to działa:
https://bitbucket.org/wolfpld/usenetarchive/src/master/
(przewiń do readme.md i obrazków)
Trochę to zagmatwane, kiedyś mnie zniechęciło do sprawdzania. Brak
bezpośredniego dostępu do tekstowych źródeł utrudnia rekonstrukcję wątków
z popsutymi referencjami czy kontynuowanych na nowej grupie.
Przy okazji zwracam uwagę, że są też dostępne archiwa grup comp.*, bez
wynalazków, zwykłe mboxy spakowane zipem.
http://archive.org/details/usenet-comp
Wiadomości są wyciągnięte z GoogleGroups! Archiwa przygotowano w 2013
roku, zanim Google popsuły dostęp do grup.
Plusem jest to, że zawierają archiwa DejaNews. Minusem jest
nieodfiltrowany spam oraz to, że wiadomości są zapisane w dość losowej
kolejności (najstarsze nie muszą mieć najniższych numerów ani być na
początku pliku), a niezadeklarowane krzaczki w treści są pozamieniane na
znaki zapytania.
--
Andrzej P. Woźniak
us...@pochta.onet.pl (zamień miejscami z<->h w adresie)
Grand Inquisitor pl.internet.pomoc Trust No.1
http://evil.pl/pip/