Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Archiwa grup dyskusyjnych, Re: Dotyczy watku "Powrot z powrotu..."

3 views
Skip to first unread message

Andrzej P. Wozniak

unread,
Dec 5, 2020, 8:46:56 AM12/5/20
to
Crosspost na pl.internet.pomoc

Osoba podpisana jako Freja Draco <frr...@poczta.fm>
w artykule <news:5fcad1b3$0$555$6578...@news.neostrada.pl> pisze:

> W dniu 2020-12-04 o 19:57, Andrzej P. Wozniak pisze:
>>
>> Ta grupa istnieje od maja 1998, więc ten wątek z całą pewnością nie
>> należy do najstarszych w archiwum. Stąd moje pytanie - dlaczego
>> akurat ten noworoczny wątek z 2004 roku? Szukałaś czegoś
>> szczególnego?
> W sumie to z założenia chciałam walnąć głupotę pt: odpowiedzmy na jakiś
> wątek sprzed dwóch dekad. Na wzmiankowanym serwerze posty zaczynają się
> od 2003 a wątki z początkiem od 2004.

Nieprawda. Na news-archive.icm.edu.pl jest (prawie) kompletna grupa
pl.rec.fantastyka.sf-f od jej powstania 6 maja 1998 r., jest też jej
poprzedniczka pl.listserv.sf-f.

> Więc wybrałam pierwszy w miarę
> sensowny.

Więc pobrałaś nagłówki wiadomości w sposób niezbyt sensowny. Może stary
Thunderbird ma limit 512K wiadomości? Na serwerze jest ich ponad 660
tysięcy.

>> może zaczęły się na liście dyskusyjnej przed powstaniem grupy
>> pl.listserv.sf-f, a archiwum listy nie dysponuję. W 2000 r. to
>> zacząłem pisać z tego adresu, a zaczynałem 3 lata wcześniej. ObSF:
>> Czy to znaczy, że jestem legendą?
> W rzeczy samej :)

Kadzisz. Bardziej szczere były wyzwiska grupowej (nie tu) lamerki, że
używam nazwiska z książki telefonicznej.

> To chyba się muszę bardziej postarać. Kiedyś widziałam w necie spakowane
> archiwa różnych grup od najsamiejszego ich początku. Coś nawet swego
> czasu ściągałam.

Archiwa pl.* i alt.pl.* są na archive.org:
https://archive.org/details/usenet-uat-pl
Można pobierać każdą grupę odzielnie lub torrenta z kompletem 337 grup.
Plusem jest to, że archiwa są kompletowane z kilku źródeł, w tym z list
dyskusyjnych istniejących przed powstaniem grup. Przy łączeniu usunięto
spam. Minusem jest fakt, że to jest jakaś wynalazkowa baza danych, do
której czytnik archiwów (tbrowser, tylko 64-bit) jest tu:
https://bitbucket.org/wolfpld/usenetarchive/downloads/
Tu możesz zobaczyć, jak to działa:
https://bitbucket.org/wolfpld/usenetarchive/src/master/
(przewiń do readme.md i obrazków)
Trochę to zagmatwane, kiedyś mnie zniechęciło do sprawdzania. Brak
bezpośredniego dostępu do tekstowych źródeł utrudnia rekonstrukcję wątków
z popsutymi referencjami czy kontynuowanych na nowej grupie.

Przy okazji zwracam uwagę, że są też dostępne archiwa grup comp.*, bez
wynalazków, zwykłe mboxy spakowane zipem.
http://archive.org/details/usenet-comp
Wiadomości są wyciągnięte z GoogleGroups! Archiwa przygotowano w 2013
roku, zanim Google popsuły dostęp do grup.
Plusem jest to, że zawierają archiwa DejaNews. Minusem jest
nieodfiltrowany spam oraz to, że wiadomości są zapisane w dość losowej
kolejności (najstarsze nie muszą mieć najniższych numerów ani być na
początku pliku), a niezadeklarowane krzaczki w treści są pozamieniane na
znaki zapytania.

--
Andrzej P. Woźniak us...@pochta.onet.pl (zamień miejscami z<->h w adresie)
Grand Inquisitor pl.internet.pomoc Trust No.1 http://evil.pl/pip/

0 new messages