Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Popbranie zawartości wikipedii

3 views
Skip to first unread message

B

unread,
Jul 26, 2010, 10:09:39 AM7/26/10
to
Witam,
Chciałem porobić pewne statystyki na temat częstotliwości
występowania rożnych słów. Doszedłem do wniosku, że artykuły wikipedii
byłby dobrą bazą do moich potrzeb. Stąd moje pytanie jak pobrać
zawartość tekstową wikipedii?

B.

Adam Przybyla

unread,
Jul 26, 2010, 1:21:57 PM7/26/10
to
... to jest dosc dobrze ukryte:
http://download.wikimedia.org/
;-))) BTW, pochwal sie co ciekawego z tego wyciagnales;-) Z powazaniem
Adam Przybyla

B

unread,
Aug 6, 2010, 9:05:06 AM8/6/10
to
W dniu 26.07.2010 19:21, Adam Przybyla pisze:

> B<B...@b.pl> wrote:
>> Witam,
>> Chciałem porobić pewne statystyki na temat częstotliwości
>> występowania rożnych słów. Doszedłem do wniosku, że artykuły wikipedii
>> byłby dobrą bazą do moich potrzeb. Stąd moje pytanie jak pobrać
>> zawartość tekstową wikipedii?
> ... to jest dosc dobrze ukryte:
> http://download.wikimedia.org/

Tak oczywiste, że nie wpadłem od razu.

> ;-))) BTW, pochwal sie co ciekawego z tego wyciagnales;-) Z powazaniem

Chciałem i chcę nadal zrobić porównanie częstotliwości pojawiania się
słów w wybranym języku. Powiedzmy, że ktoś chciałby wiedzieć ile
potrzeba znać słów i których to by znać 50%, 80% czy 90% potrzebnych
słów do zrozumienia tekstu w danym języku.

Na początek pójdą języki pozycyjne jak angielski i niemiecki potem
jakieś proste aglutynacyjne np. esperanto i mniej proste jak węgierski.
Do polskiego bez zewnętrznej pomocy to się chyba nie odważę.

b.

Adam Przybyla

unread,
Aug 7, 2010, 1:01:41 PM8/7/10
to
... na kurniku sa odmiany, o ile pamietam:
http://www.sjp.pl/slownik/po.phtml
takie czasy, ze u nas nauka zajmoja sie w kurniku, reszta pozuje
na naukowcow;-) pytanie czy odmiane bedziesz liczyl jako oddzielne slowo
czy nie? Z powazaniem
Adam Przybyla
0 new messages