"Restrykcyjne prawo autorskie ogranicza także rozwój naukowy
Chciałbym zwrócić uwagę na aspekt,..... a mianowicie na negatywne efekty
restrykcyjnego prawa autorskiego dla nauki.
Jestem adiunktem w Instytucie Podstaw Informatyki PAN, kierownikiem
Zespołu Inżynierii Lingwistycznej. Zajmuję się dziedziną nauki i
inżynierii zwaną przetwarzaniem języka naturalnego. Jej celem jest
spowodowanie, by komputery rozumiały teksty. Przykłady zastosowań to
tłumaczenie maszynowe i wyszukiwanie informacji w tekstach (a nie tylko
wyszukiwanie słów kluczowych, jak ma to miejsce w obecnych
przeszukiwarkach internetowych). Takie metody zaczynają wkraczać do
codziennych zastosowań (pracują nad nimi
m.in. duże zespoły badawcze w
firmach takich jak Google i Microsoft), a więc ich wartość jest nie
tylko naukowa, ale -- coraz bardziej -- także gospodarcza.
Do stworzenia narzędzi przetwarzania tekstów często stosuje się...
teksty, ale odpowiednio dobrane i znakowane. Takie zbiory tekstów zwane
są korpusami. Korpusy liczą setki milionów słów; na przykład
największy obecnie korpus języka polskiego, Korpus IPI PAN
(
http://korpus.pl/) stworzony w moim zespole, liczy ponad 200 milionów
słów. Ponieważ korpus ma reprezentować dany język, muszą do niego
wchodzić teksty różnorakie: gazetowe, beletrystyczne, naukowe, zapisy
mowy itd. Dla wielu języków istnieją wielkie korpusy narodowe; w
wypadku języka polskiego taki korpus jest obecnie tworzony pod moim
kierunkiem przez konsorcjum 4 instytucji (
http://nkjp.pl/) w ramach
projektu finansowanego przez Ministerstwo Nauki i Szkolnictwa Wyższego.
Niestety, restrykcyjne prawo autorskie bardzo utrudnia tworzenie takich
korpusów. Ponieważ korpusy są udostępniane przez Internet (w taki
jednak sposób, że praktycznie nie jest możliwe odtworzenie pełnych
tekstów wchodzących w skład korpusu, a więc chronione są podstawowe
interesy właścicieli praw autorskich), żeby pozostać w zgodzie z polskim
prawem autorskim musimy zdobyć odpowiednią licencję na przetwarzanie
każdego z tekstów w korpusie. Wziąwszy pod uwagę wielkość korpusu,
oznacza to konieczność dotarcia do setek, jeżeli nie tysięcy właścicieli
odpowiednich praw, z których niektórzy mogą się bezinteresownie zgodzić
na takie wykorzystanie ich tekstów, zaś inni nie. Nie muszę dodawać,
że ,,akwizycja'' tekstów stanowi przez to istotny składnik budżetu
takiego projektu (finansowanego z naszych podatków...).
Co gorsza, niekiedy prawo autorskie praktycznie uniemożliwia legalne
pozyskanie tekstów. Na przykład, przynajmniej wedłgu niektórych
interpretacji prawnych, aby mieć zgodę na przetwarzanie całego numeru
gazety, powinniśmy dotrzeć do każdego autora każdego tekstu w tej
gazecie, a także do czytelników, których głosy -- często anonimowe! --
są drukowane w tym numerze.
Warto więc może w debacie na temat restrykcyjnego prawa autorskiego
pamiętać o tym, że jest to debata nie tylko na temat granic wolności
kultury, ale także na temat tego, kiedy -- dzięki rozwojowi technologii
lingwistyczno-komputerowych -- będziemy mogli wydawać komputerowi
polecenia w języku polskim i kiedy możliwe będzie odnajdowanie stron
internetowych na podstawie ich faktycznej treści, a nie obecności tych a
nie innych słów kluczowych.
Z poważaniem,
dr Adam Przepiórkowski."