cd. ACTA

3 views
Skip to first unread message

zen

unread,
Feb 1, 2012, 3:12:46 PM2/1/12
to dip_...@lgo.pl, stop-poli...@googlegroups.com

"Restrykcyjne prawo autorskie ogranicza także rozwój naukowy

 Chciałbym zwrócić uwagę na aspekt,..... a mianowicie na negatywne efekty restrykcyjnego prawa autorskiego dla nauki. Jestem adiunktem w Instytucie Podstaw Informatyki PAN, kierownikiem Zespołu Inżynierii Lingwistycznej. Zajmuję się dziedziną nauki i inżynierii zwaną przetwarzaniem języka naturalnego. Jej celem jest spowodowanie, by komputery rozumiały teksty. Przykłady zastosowań to tłumaczenie maszynowe i wyszukiwanie informacji w tekstach (a nie tylko wyszukiwanie słów kluczowych, jak ma to miejsce w obecnych przeszukiwarkach internetowych). Takie metody zaczynają wkraczać do codziennych zastosowań (pracują nad nimi m.in. duże zespoły badawcze w firmach takich jak Google i Microsoft), a więc ich wartość jest nie tylko naukowa, ale -- coraz bardziej -- także gospodarcza. Do stworzenia narzędzi przetwarzania tekstów często stosuje się... teksty, ale odpowiednio dobrane i znakowane. Takie zbiory tekstów zwane są korpusami. Korpusy liczą setki milionów słów; na przykład największy obecnie korpus języka polskiego, Korpus IPI PAN (http://korpus.pl/) stworzony w moim zespole, liczy ponad 200 milionów słów. Ponieważ korpus ma reprezentować dany język, muszą do niego wchodzić teksty różnorakie: gazetowe, beletrystyczne, naukowe, zapisy mowy itd. Dla wielu języków istnieją wielkie korpusy narodowe; w wypadku języka polskiego taki korpus jest obecnie tworzony pod moim kierunkiem przez konsorcjum 4 instytucji (http://nkjp.pl/) w ramach projektu finansowanego przez Ministerstwo Nauki i Szkolnictwa Wyższego. Niestety, restrykcyjne prawo autorskie bardzo utrudnia tworzenie takich korpusów. Ponieważ korpusy są udostępniane przez Internet (w taki jednak sposób, że praktycznie nie jest możliwe odtworzenie pełnych tekstów wchodzących w skład korpusu, a więc chronione są podstawowe interesy właścicieli praw autorskich), żeby pozostać w zgodzie z polskim prawem autorskim musimy zdobyć odpowiednią licencję na przetwarzanie każdego z tekstów w korpusie. Wziąwszy pod uwagę wielkość korpusu, oznacza to konieczność dotarcia do setek, jeżeli nie tysięcy właścicieli odpowiednich praw, z których niektórzy mogą się bezinteresownie zgodzić na takie wykorzystanie ich tekstów, zaś inni nie. Nie muszę dodawać, że ,,akwizycja'' tekstów stanowi przez to istotny składnik budżetu takiego projektu (finansowanego z naszych podatków...). Co gorsza, niekiedy prawo autorskie praktycznie uniemożliwia legalne pozyskanie tekstów. Na przykład, przynajmniej wedłgu niektórych interpretacji prawnych, aby mieć zgodę na przetwarzanie całego numeru gazety, powinniśmy dotrzeć do każdego autora każdego tekstu w tej gazecie, a także do czytelników, których głosy -- często anonimowe! -- są drukowane w tym numerze. Warto więc może w debacie na temat restrykcyjnego prawa autorskiego pamiętać o tym, że jest to debata nie tylko na temat granic wolności kultury, ale także na temat tego, kiedy -- dzięki rozwojowi technologii lingwistyczno-komputerowych -- będziemy mogli wydawać komputerowi polecenia w języku polskim i kiedy możliwe będzie odnajdowanie stron internetowych na podstawie ich faktycznej treści, a nie obecności tych a nie innych słów kluczowych. Z poważaniem, dr Adam Przepiórkowski."
Reply all
Reply to author
Forward
0 new messages