Pääsääntöisesti (harvinaiset poikkeukset voimme unohtaa) kirja on
vapaa (public domain), kun
1. USA-sääntö: julkaistu ennen vuotta 1923 missä tahansa, määräaika
pysyy samana vuoteen 2018 asti. USA:n laki ja kansainväliset
sopimukset takaavat sen, että he voivat julkaista myös suomalaisia
kirjoja, esim. Quo vadiksen, vaikka joku tekijöistä ei olekaan ollut
kuolleena vielä 70 vuotta. EU:n sisältä ja sisällä ei ole lupa
levittää edelleen tällaista rajatapausta, mutta EU:n ulkopuolella
olevalta serveriltä kirjaa voi vapaasti ladata omalle koneelle
henkilökohtaiseen käyttöön. DP kertoo a.o. kohdassa Talvion
kuolinvuoden. Muutaman sivun oikoluku silloin tällöin ei juristien
nykykäsityksen mukaan riko tekijänoikeuslakia edes EU:ssa. Kyse ei ole
siis juridiikasta vaan moraalista; PG jättää tällaiset asiat jokaisen
itsensä päätettäväksi.
2. EU-sääntö: tekijän/kääntäjän/graafikon kuolemasta on kulunut yli 70
vuotta. Jos kirja on julkaistu v. 1922 jälkeen, se ei ole vapaa
USA:ssa, useimmiten muualla kylläkin! Suomen laki on yksiselitteisesti
EU-direktiivin mukainen, esim. Ranskassa ja Espanjassa on hankaliakin
poikkeuksia, uudet EU-maat ovat asia sinänsä. Hieno juttu meille, nyt
esim. Eino Leinon ja Uuno Kailaan koko tuotanto (mahd. toimittajien
kommentteja ja grafiikkaa lukuun ottamatta) on siis käytettävissämme.
Löytyisikö näihin projekteihin täältä vapaaehtoisia? Beta-testauksessa
on jo DP Europe ja perusteilla PG EU/Europe omia lakejamme
noudattamaan, jolloin myös ääkkösongelmat poistuvat ja mahdollistuu
kreikan, venäjän yms. kirjoittaminen suoraan ilman translitterointia
(unicode, UTF-8 enkoodaus).
3. Bernin sopimus: tekijän kuolemasta on kulunut yli 50 vuotta. Tämä
on se "oikea" sääntö, jota lähes koko maailma noudatti vielä
1990-luvun alussa. Amerikkalaisten ja EU:n suuryritysten
painostuksesta on copyright-aikoja oleellisesti pidennetty, mitä
saattaa tapahtua ahneuden lisääntyessä vastakin... Bernin sopimusta
noudattavat edelleen mm. Australia, Kanada, Serbia, Turkki, Venäjä.
Nämä maat voivat julkaista suomalaisenkin kirjan oman 50+ sääntönsä
puitteissa, samoin EU antaa heille vastavuoroisesti vain tuon 50
vuoden suojan.
Yllä oleva perustuu monen vuoden aikana keräämääni kokemukseen. Olen
heti valmis muuttamaan kantaani, jos joku toista todistaa, mutta
siihen tarvitaankin sitten lakipykälät, valmistelijan perustelut,
prejudikaatit, kansainväliset sopimukset yms.
Tapio
> esim. Eino Leinon ja Uuno Kailaan koko tuotanto (mahd. toimittajien
> kommentteja ja grafiikkaa lukuun ottamatta) on siis käytettävissämme.
> Löytyisikö näihin projekteihin täältä vapaaehtoisia? Beta-testauksessa
Mitä saa tehdä? Minä voisin olla vapaaehtoinen.
> 1990-luvun alussa. Amerikkalaisten ja EU:n suuryritysten
> painostuksesta on copyright-aikoja oleellisesti pidennetty, mitä
> saattaa tapahtua ahneuden lisääntyessä vastakin... Bernin sopimusta
Ja niin tapahtuu hyvin todennäköisesti. Joku tolkku pitäisi saada
aikaiseksi.
--
Internationale persona non grata http://kotisivu.dnainternet.net/moilami1
> esim. Eino Leinon ja Uuno Kailaan koko tuotanto (mahd. toimittajien
> kommentteja ja grafiikkaa lukuun ottamatta) on siis käytettävissämme.
Mitenköhän muuten tekijänoikeuslaki suhtautuu kirjojen
kustantajakohtaisiin alkulehtiin (siis niihin joissa on lueteltu nimike,
tekijä sekä julkaisijan ja painopaikan tiedot yms.)?
Olen viime aikoina skannaillut ja pdf:ännyt omaan käyttöön joitakin
itseäni kiinnostavia kirjoja, koska tietokoneiden nopeus ja levytila
alkaa jo riittää tuollaisten tiedostojen kotikäsittelyyn (tavallinen
200-300-sivuinen romaani menee kompressoituna pdf:nä n. 5-10
megatavuun). Nettiyhteyksien nopeutuessa ja serveritilan laajentuessa
pdf:ien käyttö alkaa pian kannattaa myös netin puolella, eikä
OCR:äämiseen työläine oikolukuineen ehkä useissa tapauksissa enää olisi
tarvetta.
Varsinkin juuri runojulkaisut kompressoituisivat hyvinkin pieniksi
pdf-fileiksi ja toisaalta myös hyötyisivät alkuperäisen muodon
säilymisestä täsmälleen sellaisenaan. Alle satasivuisen runokokoelman
skannaus on nykylaitteilla jopa alle puolen tunnin homma.
Kuitenkin, jos ruvettaisiin levittämään suoraan kustantajien
julkaisuista kopioituja sivuja, niin onko tässä jotakin lainvastaista -
jos nyt oletetaan, ettei teoksessa ole muuta toimituksellista aineistoa
kuin alkulehdet? Onko sillä *muodolla*, johon esim. jokin nykyajan
kustantaja muokkaa vaikkapa 1800-luvulla eläneen kirjailijan teoksen,
jonkinlainen suoja, vai voiko sitä kopioituna/skannattuna vapaasti
levittää sellaisenaan?
Entä, jos kopioiden levitys Public Domain -kirjoista olisikin yleisesti
sallittua, niin mikä määrä toimituksellista aineistoa riittää antamaan
sille suojan kopioiden levittämistä vastaan? Ilmeisesti erillinen
esittelyartikkeli, johdanto tms. riittää tähän, mutta entä toimittajan
lyhyet alanootit yms? Saako PD-teoksen varmuudella levitysvapaaksi,
pyyhkimällä kaikki toimittajien reunahuomautukset kuvatuilta sivuilta,
vai voiko "kumitusta" tehdessään jopa syyllistyä johonkin uuteen
rötökseen, koska julkaisumuoto kuitenkin on muutoin selvästi kustantajan
tekemä?
En ole henkilökohtaisesti aloittamassa pdf-julkaisujen levittämistä,
mutta omaan käyttöön filejä tekaistessa olen hämmästellyt miten nopeasti
ja pieneen tilaan joitakin teoksia on mahdollista kompressoida laadun
heikkenemättä yhtään (mustavalkoisen jpg-kompressointi ei kadota
informaatioita, koska välisävyjä ei ole). Kirjat ovat tällöin kooltaan
lähes kuin musiikkikappaleiden mp3-filet.
Mikäli copyright- tai muita oikeusongelmia ei ole, niin pdf voisi
lopultakin tarjota sellaisen muotoalustan, jossa vanha suomalainenkin
kirjallisuus saataisiin suhteellisen vaivattomasti kaikkien saatavilla
olevaan nettikirjastoon.
--
Esa
Saa tehdä mitä vain tuotannon eri vaiheita omien halujen ja kokemuksen
mukaan. Tarvittaessa opastetaan alkuun. Kirjat skannataan (osalle jo
niin tehty), oikoluetaan parina joko offline tai suuremmalla joukolla
sivu sivulta -menetelmällä online ja jälkikäsitellään, minkä jälkeen
toimitan ne yleisön saataville maailmanlaajuisesti. PG:lle on juuri
ilmestynyt Ahon Juha, Lassilan Tulitikkuja lainaamassa ja Danten
Divina Commedian Helvetti selityksineen.
Mihinkään ei tarvitse sitoutua, voi toimia ihan oman aikataulun
puitteissa.
Se testivaiheessa oleva eurooppalainen oikolukupaikka eli DP Europe
löytyy osoitteesta:
Käyttöliittymä on suomennettu, samoin ohjeet, joten ei ole pakko osata
paljon edes englantia. Team Finlandiin kannattaa tietysti liittyä
sisäänkirjautumisen jälkeen. Sinne tulee hieman myöhemmin lisää
suomenkielisiä kirjoja, Canthin Työmiehen vaimo on jo tehty.
Jos lähetät postia minulle privaatisti, muista poistaa spam-esto
osoitteestani.
Tapio
>Mitenköhän muuten tekijänoikeuslaki suhtautuu kirjojen
>kustantajakohtaisiin alkulehtiin (siis niihin joissa on lueteltu nimike,
>tekijä sekä julkaisijan ja painopaikan tiedot yms.)?
PG jättää kustantajakohtaiset tiedot pois; vain nimike, tekijä sekä
julkaisuvuosi otetaan mukaan. Tekijänoikeuslaki ei varsinaisesti tätä
edellytä, mutta emme sitoudu mihinkään tiettyyn painokseen, teemme
public domain -kirjasta uuden digitalisoidun julkaisun.
>Olen viime aikoina skannaillut ja pdf:ännyt omaan käyttöön joitakin
>itseäni kiinnostavia kirjoja
Pdf on nopea valmistaa ja sopii hyvin omaan käyttöön, itsekin olen
tehnyt noin harvinaisemmille shakkikirjoille.
>Varsinkin juuri runojulkaisut kompressoituisivat hyvinkin pieniksi
>pdf-fileiksi ja toisaalta myös hyötyisivät alkuperäisen muodon
>säilymisestä täsmälleen sellaisenaan. Alle satasivuisen runokokoelman
>skannaus on nykylaitteilla jopa alle puolen tunnin homma.
Netistä löytyy kyllä kirjoja pdf-muodossakin, mutta ne eivät vielä ole
saavuttaneet kovin suurta suosiota. Pdf:ssä on muutama ongelma:
- ohjelmakoodi on salaista eikä pdf aukea kaikissa lukulaitteissa
- OCR-tunnistamattomasta pdf-kuvasta ei voi tehdä tekstihakuja
- tekstiä ei voi kopioida tai editoida
- ei toimi esim. näkövammaisten puhesyntetisaattorissa
>Onko sillä *muodolla*, johon esim. jokin nykyajan
>kustantaja muokkaa vaikkapa 1800-luvulla eläneen kirjailijan teoksen,
>jonkinlainen suoja, vai voiko sitä kopioituna/skannattuna vapaasti
>levittää sellaisenaan?
Muodolla ei yleensä ole merkitystä, digikuvattua/skannattua
materiaalia on paljonkin tarjolla maailmalla. Yleiset
copyright-säännöt pätevät.
>mikä määrä toimituksellista aineistoa riittää antamaan
>sille suojan kopioiden levittämistä vastaan? Ilmeisesti erillinen
>esittelyartikkeli, johdanto tms. riittää tähän, mutta entä toimittajan
>lyhyet alanootit yms? Saako PD-teoksen varmuudella levitysvapaaksi,
>pyyhkimällä kaikki toimittajien reunahuomautukset kuvatuilta sivuilta,
Jos jäljelle jää vain vapaan alkuperäisen painoksen materiaali, on
kaikki ok. Esipuhe, alaviitteet, hakemisto, kuvitus jne. saavat kukin
erikseen tekijänoikeudellisen suojan, muutaman painovirheen
korjaaminen tai kappalejaon muuttaminen ei. Runoista on erityisesti
muistettava, että toimituksen valitsema runokokoelma ei useinkaan ole
vapaa, vaikka yksittäiset runot voivat ollakin.
>Mikäli copyright- tai muita oikeusongelmia ei ole, niin pdf voisi
>lopultakin tarjota sellaisen muotoalustan, jossa vanha suomalainenkin
>kirjallisuus saataisiin suhteellisen vaivattomasti kaikkien saatavilla
>olevaan nettikirjastoon.
Tuo on jo nyt jossain määrin toimiva, halpa ja nopea ratkaisu
digitalisointiin. Yleistynee tulevaisuudessa lisää ongelmista
huolimatta.
Tapio
> "Esa Toivonen" <esa.to...@pp3.inet.fi> kirjoitti:
> > Mikäli copyright- tai muita oikeusongelmia ei ole, niin pdf voisi
> > lopultakin tarjota sellaisen muotoalustan, jossa vanha suomalainenkin
> > kirjallisuus saataisiin suhteellisen vaivattomasti kaikkien saatavilla
> > olevaan nettikirjastoon.
> PDF on kyllä kovasti raskas ja hankala. Kun teksti on kuvana, sitä ei voi
> mukavasti muotoilla kulloisenkin näyttölaitteen mukaan. E-teksteissä
> lukulaite voi olla myös jotain muuta kuin tietokone. Itse olen paljonkin
> käyttänyt aikaisemmin palm kämmentietokonetta, ja nykyään Sony-Ericsson p800
> kännykkääni e-tekstien lukemiseen. Tuo kännykkä taitaa kyllä pdf:kin osata
> näyttää, mutta käyttömukavuus ja nopeus on noin 1000 x heikompi kuin
> tekstimuotoisilla tiedostoilla.
Kieltämättä kuvista tehty pdf on muokkautumattomampi kuin vapaa teksti
tekstinkäsittelyohjelmassa, mutta jos tarkoitat pelkästään tekstin
mukaan ottamista tai kotona esim. vuodelukemiseksi saamista, niin
käsittääkseni pdf on likimain perinteisen painetun kirjan veroinen,
sikäli että sopivan lukuannoksen printtaaminen kerrallaan onnistuu
nopeasti ja sen jälkeen nivaska on valmis siirreltäväksi minne tahansa
mukana, eikä ole niin tarkkaa kunnossapysymisen kanssakaan (esim.
kylvyssä lukeminen), koska aina voi edullisesti printata uudet kopiot.
Ainut isompi ongelma on saada skannaus tehdyksi vahingoittamatta
alkuperäistä kirjakappaletta, mutta esim. oman hyllyn kestosuosikkien
muuntaminen pdf:ksi alkaa jo olla varsin vaivatonta ja tilaa säästävää
puuhaa - ellei nyt satu olemaan sillä tavalla kirjoihin rakastunut, että
haluaa tuntea nimenomaan kirjan esineenä, kansineen kaikkineen
käsissään. A4-kopionivaska on aina aavistuksen verran löysä pideltävä,
niittaa sen kokoon miten hyvänsä, ja aukeamaskannauksissa on yllättävän
vaikea saada molempia sivuja ihan suoriksi, ellei kirjan keskiosalle tee
pientä väkivaltaa. Muutaman sadan sivun kovakantiset teokset onnistuvat
helpoiten.
--
Esa
Höpsis. PDF ei pysty tarjoamaan mitään niille, joille sähköisestä
muodosta on hyötyä painettuun verrattuna. Ts. siitä ei ole
nettikirjastolle mitään iloa, tuhlaa vielä järjettömästi tilaa/kaistaa.
> > PDF on kyllä kovasti raskas ja hankala. Kun teksti on kuvana, sitä ei voi
> > mukavasti muotoilla kulloisenkin näyttölaitteen mukaan.
Juu, kuvamuotoisia PDFiä on tosi huono lukea ruudulla. Yritetty on, monet
tieteelliset lehdet onnistuu saamaan käsiin vain noina PDFinä.
> Kieltämättä kuvista tehty pdf on muokkautumattomampi kuin vapaa teksti
> tekstinkäsittelyohjelmassa, mutta jos tarkoitat pelkästään tekstin
> mukaan ottamista tai kotona esim. vuodelukemiseksi saamista, niin
> käsittääkseni pdf on likimain perinteisen painetun kirjan veroinen,
> sikäli että sopivan lukuannoksen printtaaminen kerrallaan onnistuu
> nopeasti ja sen jälkeen nivaska on valmis siirreltäväksi minne tahansa
> mukana, eikä ole niin tarkkaa kunnossapysymisen kanssakaan (esim.
> kylvyssä lukeminen), koska aina voi edullisesti printata uudet kopiot.
Hm. Mulla kerta-annos on noin 500 sivua, jos kirja on hyvä...
PDF:n ongelma on ettei niitä oikein voi lukea ruudulla, ja paperille
tulostuksessa ei ole senkään vertaa järkeä.
> Ainut isompi ongelma on saada skannaus tehdyksi vahingoittamatta
> alkuperäistä kirjakappaletta, mutta esim. oman hyllyn kestosuosikkien
> muuntaminen pdf:ksi alkaa jo olla varsin vaivatonta ja tilaa säästävää
> puuhaa - ellei nyt satu olemaan sillä tavalla kirjoihin rakastunut, että
> haluaa tuntea nimenomaan kirjan esineenä, kansineen kaikkineen
> käsissään.
Säästää tilaa kirjahyllyssä, mutta yleensä auttaa se, että lahjoittaa/myy
pois ne kirjat jotka tulevat tulevaisuudessa olemaan saatavissa
kirjastoista tms. Mulla jäis varmaan vaan jotain puoli hyllymetriä
sellaisia kirjoja, joita ei lähes kaikista kirjastoista löydä. Niistäkin
ainakin puolet siksi että ovat englannin kielisiä.
> A4-kopionivaska on aina aavistuksen verran löysä pideltävä,
> niittaa sen kokoon miten hyvänsä, ja aukeamaskannauksissa on yllättävän
> vaikea saada molempia sivuja ihan suoriksi, ellei kirjan keskiosalle tee
> pientä väkivaltaa. Muutaman sadan sivun kovakantiset teokset onnistuvat
> helpoiten.
Kuinka kauan menee jonkun 500 sivuisen romaanin skannaamiseen ja
printtaamiseen? Musta tuntuu, että siinä menee yhtä kauan kuin ko. kirjan
lukemiseen. Jotenkin tuntuu järjettömältä, etenkään kuin niitä ei oikein
voi lukea kuin tulostamalla järkyttävän kasan A4sia. Jos taas lukee aina
uudelleen samoja kirjoja, niin jatkuva uudelleenprinttaus on moneltakin
kannalta typerää. (tilaa säästettäessähän ne printit pitää aina hävittää
heti käytön jälkeen, muuten ei mitään tilaa säästy.)
--
Lauri Raittila <http://www.iki.fi/lr> <http://www.iki.fi/zwak/fonts>
Saapi lähettää meiliä, jos aihe ei liity ryhmään, tai on yksityinen
tjsp., mutta älä lähetä samaa viestiä meilitse ja ryhmään.
> Esa Toivonen wrote:
> > Timo MK Pietilä <spam...@jippii.fi> wrote:
> >
> > > "Esa Toivonen" <esa.to...@pp3.inet.fi> kirjoitti:
> > > > Mikäli copyright- tai muita oikeusongelmia ei ole, niin pdf voisi
> > > > lopultakin tarjota sellaisen muotoalustan, jossa vanha suomalainenkin
> > > > kirjallisuus saataisiin suhteellisen vaivattomasti kaikkien saatavilla
> > > > olevaan nettikirjastoon.
>
> Höpsis. PDF ei pysty tarjoamaan mitään niille, joille sähköisestä
> muodosta on hyötyä painettuun verrattuna. Ts. siitä ei ole
> nettikirjastolle mitään iloa, tuhlaa vielä järjettömästi tilaa/kaistaa.
Tilaongelmaa ei ole tavallisten tekstiteosten kanssa, koska about
samassa kokoluokassa painivia mp3:siakin on jo vuosien ajan vaihdeltu
netissä ympäriinsä valtavia määriä. Ja tietysti: YKSI nettikirjasto
riittäisi kattamaan kaikkien "tavallisten" suomalaisten lukijoiden
tarpeet sisältämiensa teosten osalta, siinä missä fyysisiä kirjastoja
pitää olla joka kunnalla omansa.
Kuvia sisältävien teosten kanssa on vielä nykyään hieman ongelmallista,
koska niissä ei ole yhtä paljon laajoja valkoisia/mustia pintoja, jotka
kompressoituisivat pieneen tilaan vailla informaation hukkaa. Muutaman
vuoden kuluttua tuollakaan ei liene enää väliä koneiden ja internetin
tehon kasvaessa.
Toisessa ääripäässä runomuotoisissa teoksissa puolestaan on paljon
valkoista, joten ne menevät lähes säännönmukaisesti muutamaan megaan
(esim. Laotsen Tao Te Ching: 1,3 Mt). Viikko sitten skannasin tähän asti
suurimman opukseni, hieman yli 600-sivuisen Augustinuksen Jumalan valtio
-järkäleen, joka kompressoitui 25 megaan. Megaisella nettiyhteydellä
vastaavan kokoisen PD-teoksen hakeminen nettikirjastosta kestäisi vain
4-5 minuuttia.
> > > PDF on kyllä kovasti raskas ja hankala. Kun teksti on kuvana, sitä ei voi
> > > mukavasti muotoilla kulloisenkin näyttölaitteen mukaan.
>
> Juu, kuvamuotoisia PDFiä on tosi huono lukea ruudulla. Yritetty on, monet
> tieteelliset lehdet onnistuu saamaan käsiin vain noina PDFinä.
Riippuu kaiketikin skannauksen resoluutiosta, alkuperäisteoksen koosta
ja toisaalta lukulaitteen monitorin koosta. Itse käyttämältäni 17 tuuman
näytöltä pystyy useimmat kaunokirjalliset teokset lukemaan aukeamina
vähintään samassa koossa kuin alkuperäisenä, ja marginaaleja ja
Reader-ohjelman työkalupalkkeja pois säätämällä aika paljon isompanakin.
300-360 dpi resoluutio riittää reiluihin suurennoksiin ja pienille
alaviitteille yms. Lukuohjelmassa aukeaman vaihto käy yhdellä näppäimen
painalluksella. Aikakauslehdet kenties vaativat mahdollisimman ison
näytön ja ovat kuvien takia työläämpiä skannata (moire-häiriöiden
descreenaaminen yms.). Olen kuitenkin puhunut nyt vain kirjojen
pdf:äämisestä.
> > Kieltämättä kuvista tehty pdf on muokkautumattomampi kuin vapaa teksti
> > tekstinkäsittelyohjelmassa, mutta jos tarkoitat pelkästään tekstin
> > mukaan ottamista tai kotona esim. vuodelukemiseksi saamista, niin
> > käsittääkseni pdf on likimain perinteisen painetun kirjan veroinen,
> > sikäli että sopivan lukuannoksen printtaaminen kerrallaan onnistuu
> > nopeasti ja sen jälkeen nivaska on valmis siirreltäväksi minne tahansa
> > mukana, eikä ole niin tarkkaa kunnossapysymisen kanssakaan (esim.
> > kylvyssä lukeminen), koska aina voi edullisesti printata uudet kopiot.
>
> Hm. Mulla kerta-annos on noin 500 sivua, jos kirja on hyvä...
> PDF:n ongelma on ettei niitä oikein voi lukea ruudulla, ja paperille
> tulostuksessa ei ole senkään vertaa järkeä.
Jos esim. kirjastot ottaisivat hommakseen tehdä skannauksen ja
muunnoksen pdf:äksi (jälkimmäisen voi täysin automatisoida mm.
Photoshopissa), suomalainen Public Domain -ikäinen kaunokirjallisuus
olisi varsin pian yleisesti saatavilla internetissä. Ei sitä niin
hirveästi ole 1930-luvun puoliväliin mennessä kuolleilta kirjailijoilta
olemassa. Uudempiahan ei saakaan kopsia kuin omaan käyttöön. Omaan
käyttöön pdf:ääminen puolestaan tulee järkeväksi uudempienkin teosten
kohdalla itseä yhä uudelleen kiinnostavien "hitaasti luettavien"
kirjojen yhteydessä (esim. filosofia, uskonto, runous...) tai vaikkapa
vaikeasti saatavissa olevien tenttikirjojen tms. materiaalin kanssa.
> > Ainut isompi ongelma on saada skannaus tehdyksi vahingoittamatta
> > alkuperäistä kirjakappaletta, mutta esim. oman hyllyn kestosuosikkien
> > muuntaminen pdf:ksi alkaa jo olla varsin vaivatonta ja tilaa säästävää
> > puuhaa - ellei nyt satu olemaan sillä tavalla kirjoihin rakastunut, että
> > haluaa tuntea nimenomaan kirjan esineenä, kansineen kaikkineen
> > käsissään.
>
> Säästää tilaa kirjahyllyssä, mutta yleensä auttaa se, että lahjoittaa/myy
> pois ne kirjat jotka tulevat tulevaisuudessa olemaan saatavissa
> kirjastoista tms. Mulla jäis varmaan vaan jotain puoli hyllymetriä
> sellaisia kirjoja, joita ei lähes kaikista kirjastoista löydä. Niistäkin
> ainakin puolet siksi että ovat englannin kielisiä.
Jotkut voisivat arvostaa sitäkin, jos omalta koneelta saisi printattua
vanhoista teoksista täysin puhtaita lukukappaleita omalle paperille.
Riippuu toisin siitä onko kiinnostunut pääasiassa kirjan
informaatiosisällöstä, vai merkitsevätkö myös ulkoiset tekijät jotain
lukukokemuksen yhteydessä. Ei puhtoisen mustavalkoinen kopionippu ikinä
kauniisti painetun kirjan tunnelmaa saavuta, jos sitäkin kaipaa. (Jonkin
verran auttaa, jos viitsii nähdä vaivaa ja printata molemmin puolin,
jolloin paperista tulee "painetumman tuntuista". :)
> > A4-kopionivaska on aina aavistuksen verran löysä pideltävä,
> > niittaa sen kokoon miten hyvänsä, ja aukeamaskannauksissa on yllättävän
> > vaikea saada molempia sivuja ihan suoriksi, ellei kirjan keskiosalle tee
> > pientä väkivaltaa. Muutaman sadan sivun kovakantiset teokset onnistuvat
> > helpoiten.
>
> Kuinka kauan menee jonkun 500 sivuisen romaanin skannaamiseen ja
> printtaamiseen? Musta tuntuu, että siinä menee yhtä kauan kuin ko. kirjan
> lukemiseen.
Hyvällä skannerilla yksi aukeama valmistuu n. puolessa minuutissa,
sisältäen myös kirjan sivun kääntämisen ja asettelun ennen seuraavaa
aukeamaa (itse skannaus ottaa 10-15 s.). Tuo aika riittää aika hyvin
tavallisen romaanin kokoisilla teoksilla, joissa on 200-400 sivua.
Paksummissa ja pienimarginaalisissa kirjoissa voi joutua näkemään
lisävaivaa, että saa keskitaitteen viereiset tekstit lasia vasten, ja
homma saattaa viedä kauemmin. Joka tapauksessa, tuo 0,5 min. per aukeama
tuottaa 240 kirjan sivua tunnissa.
> Jotenkin tuntuu järjettömältä, etenkään kuin niitä ei oikein
> voi lukea kuin tulostamalla järkyttävän kasan A4sia. Jos taas lukee aina
> uudelleen samoja kirjoja, niin jatkuva uudelleenprinttaus on moneltakin
> kannalta typerää. (tilaa säästettäessähän ne printit pitää aina hävittää
> heti käytön jälkeen, muuten ei mitään tilaa säästy.)
Tilaa säästyy siinä, ettei kaikkien teosten tarvitse olla jatkuvasti
paperilla. Luetut voi heittää pois, jollei arvele piakkoin uudelleen
tarvitsevansa. Kopiopaperi maksaa vain centin/siivu. Jos haluaa oikeasti
säästää, voi printata samaan nippuun ensin parilliset ja sitten
parittomat sivut eri puolille. Mutta kieltämättä pdf:fäys ei välttämättä
tuo etuja sellaiselle, joka haluaa kovin usein lukea 500 sivua illassa -
paitsi jos on itseä tyydyttävän iso näyttö käytettävissä. Minulla
näytöltä lukeminenkin siis toimii ja siitä on jopa tiettyjä etuja
verrattuna oikosenaan paperilta lukemiseen (ei mm. ala nukuttamaan niin
vikkelästi :).
--
Esa
> Höpsis. PDF ei pysty tarjoamaan mitään niille, joille sähköisestä
> muodosta on hyötyä painettuun verrattuna. Ts. siitä ei ole
> nettikirjastolle mitään iloa, tuhlaa vielä järjettömästi
tilaa/kaistaa.
Mutta jos haluaa lukea vaikkapa 30-luvun pulp-lukemistoja (kuten vaikka
The Shadow tai DocSavage -seikkailuja) niin PDF tarjoaa huomattavasti
miellyttävämmän kokemuksen nuhjuisine ulkuasuineen ja
alkuperäiskuvituksineen.
http://members.cox.net/comingattractions/etexts.html
Korjaus edelliseen: Näemmä juuri The Shadow ja DocSavage pdf-tiedostot
ovat häipyneet tarjonnasta tämän vuoden alusta. Voipi olla että ne
ilmaantuvat joskus lähitulevaisuudessa maksulliseen tarjontaan.
Mutta muuta pulppia on silti yhä tarjolla.
Uuno Kailaan tuotanto olisi tosiaan hyvä
saada verkkoon. Runokirjoja on sitä paitsi
nopea skannata.
--
--
J. J. Marjanen
j...@pcuf.fi
http://www.pcuf.fi/~jjm/
Tapio Riikonen <tapio.r...@luukkuPOIS.com> kirjoitti
viestissä:402275f6...@news.kolumbus.fi...
> Tilaongelmaa ei ole tavallisten tekstiteosten kanssa, koska about
> samassa kokoluokassa painivia mp3:siakin on jo vuosien ajan vaihdeltu
> netissä ympäriinsä valtavia määriä.
Nimenomaan vaihdettu, eikä pidetty jossain paikassa kaikien saatavilla
ilmaiseksi.
> Toisessa ääripäässä runomuotoisissa teoksissa puolestaan on paljon
> valkoista, joten ne menevät lähes säännönmukaisesti muutamaan megaan
> (esim. Laotsen Tao Te Ching: 1,3 Mt). Viikko sitten skannasin tähän asti
> suurimman opukseni, hieman yli 600-sivuisen Augustinuksen Jumalan valtio
> -järkäleen, joka kompressoitui 25 megaan. Megaisella nettiyhteydellä
> vastaavan kokoisen PD-teoksen hakeminen nettikirjastosta kestäisi vain
> 4-5 minuuttia.
Tuollaiset runokirjat tms. voivatkin olla järkeenkäypiä kuvamuodossa,
koska niissä ulkoasullakin on usein merkitystä.
> Riippuu kaiketikin skannauksen resoluutiosta, alkuperäisteoksen koosta
> ja toisaalta lukulaitteen monitorin koosta. Itse käyttämältäni 17 tuuman
> näytöltä pystyy useimmat kaunokirjalliset teokset lukemaan aukeamina
> vähintään samassa koossa kuin alkuperäisenä, ja marginaaleja ja
> Reader-ohjelman työkalupalkkeja pois säätämällä aika paljon isompanakin.
> 300-360 dpi resoluutio riittää reiluihin suurennoksiin ja pienille
> alaviitteille yms. Lukuohjelmassa aukeaman vaihto käy yhdellä näppäimen
> painalluksella.
Mä olen kokeillut 15" ja 17" näytöillä. Kenties ne vain oli skannattu
huonolla laadulla. Ei se ollu koko joka tökki, vaan se ettei saanut
selvää.
> Jos esim. kirjastot ottaisivat hommakseen tehdä skannauksen ja
> muunnoksen pdf:äksi (jälkimmäisen voi täysin automatisoida mm.
> Photoshopissa), suomalainen Public Domain -ikäinen kaunokirjallisuus
> olisi varsin pian yleisesti saatavilla internetissä. Ei sitä niin
> hirveästi ole 1930-luvun puoliväliin mennessä kuolleilta kirjailijoilta
> olemassa.
Mutta kuka niitä siinä muodossa lukisi? Joku voisi kehittää formaatin,
joka aluksi tallentaisi kuvana, mutta ihminen sitten voisi sana
kerrallaan muuttaa tekstiksi - oikoluku helpottuisi selvästi, kun ei
tavitsisi verrata alkuperäiseen/miettiä mitään. Ja jos vaan muutaman
sanan sieltä täältä korvaisi, niin ei menisi kovin hirveästi aikaakaan.
100 ihmistä kun olisi lukenut kirjan, niin alkaisi olla valmis.
Tuo oikolukuhomma josta täälläkin on ollut puhetta on toki tehokkaampi,
mutta vaatii myös paljon enemmän.
> Uudempiahan ei saakaan kopsia kuin omaan käyttöön. Omaan
> käyttöön pdf:ääminen puolestaan tulee järkeväksi uudempienkin teosten
> kohdalla itseä yhä uudelleen kiinnostavien "hitaasti luettavien"
> kirjojen yhteydessä (esim. filosofia, uskonto, runous...) tai vaikkapa
> vaikeasti saatavissa olevien tenttikirjojen tms. materiaalin kanssa.
Ehkäpä. Mutta valokopioiminen tuntuu ihan yhtä huonolta/hyvältä
tavalta...
> Jotkut voisivat arvostaa sitäkin, jos omalta koneelta saisi printattua
> vanhoista teoksista täysin puhtaita lukukappaleita omalle paperille.
> Riippuu toisin siitä onko kiinnostunut pääasiassa kirjan
> informaatiosisällöstä, vai merkitsevätkö myös ulkoiset tekijät jotain
> lukukokemuksen yhteydessä. Ei puhtoisen mustavalkoinen kopionippu ikinä
> kauniisti painetun kirjan tunnelmaa saavuta, jos sitäkin kaipaa. (Jonkin
> verran auttaa, jos viitsii nähdä vaivaa ja printata molemmin puolin,
> jolloin paperista tulee "painetumman tuntuista". :)
Minua ärsyttää tuo järkyttävä paperin tuhlaus... En voisi olla vähempää
kiinnostunut, minkä näköistä nivaskaa luen.
> > Kuinka kauan menee jonkun 500 sivuisen romaanin skannaamiseen ja
> > printtaamiseen? Musta tuntuu, että siinä menee yhtä kauan kuin ko. kirjan
> > lukemiseen.
>
> Hyvällä skannerilla yksi aukeama valmistuu n. puolessa minuutissa,
> sisältäen myös kirjan sivun kääntämisen ja asettelun ennen seuraavaa
> aukeamaa (itse skannaus ottaa 10-15 s.). Tuo aika riittää aika hyvin
> tavallisen romaanin kokoisilla teoksilla, joissa on 200-400 sivua.
> Paksummissa ja pienimarginaalisissa kirjoissa voi joutua näkemään
> lisävaivaa, että saa keskitaitteen viereiset tekstit lasia vasten, ja
> homma saattaa viedä kauemmin. Joka tapauksessa, tuo 0,5 min. per aukeama
> tuottaa 240 kirjan sivua tunnissa.
No, eihän siihen mene kuin puolet lukemiseen kuluvasta ajasta. Silti aika
paljon, jos omaan käyttöön jää.
> > Jotenkin tuntuu järjettömältä, etenkään kuin niitä ei oikein
> > voi lukea kuin tulostamalla järkyttävän kasan A4sia. Jos taas lukee aina
> > uudelleen samoja kirjoja, niin jatkuva uudelleenprinttaus on moneltakin
> > kannalta typerää. (tilaa säästettäessähän ne printit pitää aina hävittää
> > heti käytön jälkeen, muuten ei mitään tilaa säästy.)
>
> Tilaa säästyy siinä, ettei kaikkien teosten tarvitse olla jatkuvasti
> paperilla. Luetut voi heittää pois, jollei arvele piakkoin uudelleen
> tarvitsevansa. Kopiopaperi maksaa vain centin/siivu.
Eli 500 sivua maksaa 5 euroa + väri. Se on suunnilleen saman verran, mitä
kirjoista muutenkin maksan... (no, keskimääräisessä tapauksessa taitaisi
jäädä samoihin hintoihin)
> Mutta kieltämättä pdf:fäys ei välttämättä
> tuo etuja sellaiselle, joka haluaa kovin usein lukea 500 sivua illassa -
> paitsi jos on itseä tyydyttävän iso näyttö käytettävissä.
Onhan toi näyttö iso (19"), mutta kun sen edessä ei oikein voi maata.
Eikä sen kanssa voi matkustaa.
> Minulla
> näytöltä lukeminenkin siis toimii ja siitä on jopa tiettyjä etuja
> verrattuna oikosenaan paperilta lukemiseen (ei mm. ala nukuttamaan niin
> vikkelästi :).
Mä tykkään lukea ulkomaankielistä tekstiä koneelta, kun silloin voi
kätevästi kopioida tuntemattomat sanat jos ne kiinnostaa - mutta sekään
ei onnistu PDF-kuvilla.
> Esa Toivonen wrote:
> > Tilaongelmaa ei ole tavallisten tekstiteosten kanssa, koska about
> > samassa kokoluokassa painivia mp3:siakin on jo vuosien ajan vaihdeltu
> > netissä ympäriinsä valtavia määriä.
>
> Nimenomaan vaihdettu, eikä pidetty jossain paikassa kaikien saatavilla
> ilmaiseksi.
Tässä (nettikirjastoista puhuttaessa) tarkoitetut kirjathan olisivat
vapaasti levitettäviä vanhoja teoksia, joten vertaisverkossa
levittäminenkin kävisi oikein hyvin laatuun, jolloin filet olisivat
hyvän kapasiteetin omaavien kotikäyttäjien levyillä.
Mutta toisaalta, jos tuo on kerran mahdollista jo nyt valtavien
musiikkimäärien kanssa, niin tuskinpa "valtiollisen" tilan järkkääminen
muutamille sadoille vanhojen suomalaisteosten dataversioille olisi
ongelma myöskään.
Jokin koko maan kirjastolaitoksen yhteishanke tuntuisi siinä mielessä
järkevältä, että originaalit olisivat siten saatavissa projektia varten,
niiden käsittelytaitoa löytyisi valmiiksi (originaaleja ei turhaan
tuhoutuisi), laadunvalvonta pelaisi parhaalla mahdollisella tavalla
(parempia versioita ensimmäisistä yritelmistä olisi helpompi tuottaa
myöhemmin tietotekniikan kehittyessä), projekti voisi edetä juohevasti
vuosi vuodelta ilman kohtuutonta painetta vain muutamalle henkilölle, ja
ainakin pääosa kirjoista olisi sitten saatavissa yhdestä ositteesta plus
kenties parista varmistuspaikasta.
Tilaongelman vähäisyyttä kenties sopii kuvaamaan, että olen omaan
käyttööni pdf:ännyt hieman yli 30 kirjaa eivätkä ne vie vasta tilaa kuin
puoli CD:llistä - siis keskimäärin 10 megan filejä.
> > Riippuu kaiketikin skannauksen resoluutiosta, alkuperäisteoksen koosta
> > ja toisaalta lukulaitteen monitorin koosta. Itse käyttämältäni 17 tuuman
> > näytöltä pystyy useimmat kaunokirjalliset teokset lukemaan aukeamina
> > vähintään samassa koossa kuin alkuperäisenä, ja marginaaleja ja
> > Reader-ohjelman työkalupalkkeja pois säätämällä aika paljon isompanakin.
> > 300-360 dpi resoluutio riittää reiluihin suurennoksiin ja pienille
> > alaviitteille yms. Lukuohjelmassa aukeaman vaihto käy yhdellä näppäimen
> > painalluksella.
>
> Mä olen kokeillut 15" ja 17" näytöillä. Kenties ne vain oli skannattu
> huonolla laadulla. Ei se ollu koko joka tökki, vaan se ettei saanut
> selvää.
Totta on, että mahdollisimman iso näyttö on tuossa eduksi, mutta
tarkoitin siis, että aukeaman aktuaalisen koon saa jo 17 tuuman näytöllä
suuremmaksi kuin useimmissa tavallisissa kirjoissa alunperin on, about
110-120 % suuruiseksi.
> > Jos esim. kirjastot ottaisivat hommakseen tehdä skannauksen ja
> > muunnoksen pdf:äksi (jälkimmäisen voi täysin automatisoida mm.
> > Photoshopissa), suomalainen Public Domain -ikäinen kaunokirjallisuus
> > olisi varsin pian yleisesti saatavilla internetissä. Ei sitä niin
> > hirveästi ole 1930-luvun puoliväliin mennessä kuolleilta kirjailijoilta
> > olemassa.
>
> Mutta kuka niitä siinä muodossa lukisi? Joku voisi kehittää formaatin,
> joka aluksi tallentaisi kuvana, mutta ihminen sitten voisi sana
> kerrallaan muuttaa tekstiksi - oikoluku helpottuisi selvästi, kun ei
> tavitsisi verrata alkuperäiseen/miettiä mitään. Ja jos vaan muutaman
> sanan sieltä täältä korvaisi, niin ei menisi kovin hirveästi aikaakaan.
> 100 ihmistä kun olisi lukenut kirjan, niin alkaisi olla valmis.
Oletan, että OCR-tulkitseminen edelleen kehittyy sietämään kaikenlaisia
paino- ja skannausjäljen poikkeamia yhä pikkutarkemmin ja
tekoälykkäämmin. Kenties 5-10 vuoden kuluttua kuvana tallennetusta
tekstistä olisi suoraan mahdollista tehdä sanahakuja OCR-tekniikan
avulla - tai toisin sanoen, voisi muuntaa useamman sata kuvaa todellakin
täysin automaattisesti virheettömäksi tekstiksi muutamassa sekunnissa -
vähän niinkuin mp3-koodaaminen on nopeutunut muutamassa vuodessa
käsittämättömästi.
Joka tapauksessa, skannaus olisi silloinkin tehtävä tavalla tai
toisella, joten siinä ei häviä paljonkaan vaikka sen tekisi
huolellisesti jo nyt ja saattaisi jo nykytilanteessakin ainakin
kuvakokoelmat (pdf) teoksista kaikkien downloadattaviksi.
> > Uudempiahan ei saakaan kopsia kuin omaan käyttöön. Omaan
> > käyttöön pdf:ääminen puolestaan tulee järkeväksi uudempienkin teosten
> > kohdalla itseä yhä uudelleen kiinnostavien "hitaasti luettavien"
> > kirjojen yhteydessä (esim. filosofia, uskonto, runous...) tai vaikkapa
> > vaikeasti saatavissa olevien tenttikirjojen tms. materiaalin kanssa.
> Ehkäpä. Mutta valokopioiminen tuntuu ihan yhtä huonolta/hyvältä
> tavalta...
Pdf-tiedostot ovat aina saatavissa, kun ne on kerran tehty.
Printtaamisessa ei tarvitse nähdä uuden kopioimisen veroista vaivaa ja
originaalin vahingoittamisen vaara ei toistu yhä uudelleen. Mitään
fyysistä teosta ei enää *välttämättä* tarvita. Jos tämä onnistuu
jotakuinkin jo nykykoneilla ja -näytöillä, niin tilanne tullee vain
paranemaan lähitulevaisuudessa.
> > Jotkut voisivat arvostaa sitäkin, jos omalta koneelta saisi printattua
> > vanhoista teoksista täysin puhtaita lukukappaleita omalle paperille.
> > Riippuu toisin siitä onko kiinnostunut pääasiassa kirjan
> > informaatiosisällöstä, vai merkitsevätkö myös ulkoiset tekijät jotain
> > lukukokemuksen yhteydessä. Ei puhtoisen mustavalkoinen kopionippu ikinä
> > kauniisti painetun kirjan tunnelmaa saavuta, jos sitäkin kaipaa. (Jonkin
> > verran auttaa, jos viitsii nähdä vaivaa ja printata molemmin puolin,
> > jolloin paperista tulee "painetumman tuntuista". :)
>
> Minua ärsyttää tuo järkyttävä paperin tuhlaus... En voisi olla vähempää
> kiinnostunut, minkä näköistä nivaskaa luen.
Uusien romaanien lukemiseen varmaankin painettu kirja (etenkin pokkari)
pysyy edelleen kätevänä muotona. Mutta niissäkin, heti kun uskoo
löytäneensä teoksen, jota viitsii lukea yhä uudelleen, kenties
vuosikymmentenkin päästä, niin miksei sellaisesta tekisi omaan käyttöön
kohtalaisen pieneen kokoon menevää datakopiota? Ei ainakaan itselleni
tulisikaan mieleen skannata datakopsuja ns. lukuromaaneista, ellei
niissä olisi jotain erityistä viehätystä - tai ellen olisi jotain puuhaa
vailla tunniksi pariksi. :)
> > Joka tapauksessa, tuo 0,5 min. per aukeama
> > tuottaa 240 kirjan sivua tunnissa.
>
> No, eihän siihen mene kuin puolet lukemiseen kuluvasta ajasta. Silti aika
> paljon, jos omaan käyttöön jää.
Niin on, jos on kyse uusista kertakäyttöromaaneista, joista ei jaksa
kiinnostua enää myöhemmin.
> > Kopiopaperi maksaa vain centin/siivu.
>
> Eli 500 sivua maksaa 5 euroa + väri. Se on suunnilleen saman verran, mitä
> kirjoista muutenkin maksan... (no, keskimääräisessä tapauksessa taitaisi
> jäädä samoihin hintoihin)
Kovat kannet nostavat hinnan heti vähintään 10-15 euron tietämiin jopa
useimmissa ale-kirjoissa - normaalihintaisissa 30-50 euron lähtöhinta
lienee aika tavallinen nykyajan uudelle kovakantiselle kirjalle.
> > Mutta kieltämättä pdf:fäys ei välttämättä
> > tuo etuja sellaiselle, joka haluaa kovin usein lukea 500 sivua illassa -
> > paitsi jos on itseä tyydyttävän iso näyttö käytettävissä.
>
> Onhan toi näyttö iso (19"), mutta kun sen edessä ei oikein voi maata.
> Eikä sen kanssa voi matkustaa.
Sopivan säädeltävän "data-tuolin" kanssa puolittain makuulta
lukeminenkin onnistuu - mutta miksipä sen pitäisi olla sen kummempaa
kuin muunkaan nykyään valtavan laajamittaisen netti-lukemisen? Saattaisi
kouluttaa ihmisiä hieman kärsivällisemmiksi tietokoneelta lukijoiksi,
kun ei oltaisi jatkuvasti siirtymässä nettisaitilta toiselle lyhyiden
infopalasten perässä. Tietokoneen ääressä tekstiin *syventyminen*
saattaisi monille olla yllättävällä ja positiivisella tavalla *uusi*
kokemus.
> > Minulla näytöltä lukeminenkin siis toimii ja siitä on jopa tiettyjä
> > etuja verrattuna oikosenaan paperilta lukemiseen (ei mm. ala nukuttamaan
> > niin vikkelästi :).
>
> Mä tykkään lukea ulkomaankielistä tekstiä koneelta, kun silloin voi
> kätevästi kopioida tuntemattomat sanat jos ne kiinnostaa - mutta sekään
> ei onnistu PDF-kuvilla.
Toisaalta, ei niitä saa klikkaamalla kopioitua kirjoistakaan, joten ei
skannatessa mitään menetäkään.
--
Esa
Minun päähäni ei todellakaan mahdu mitä hyötyä PDF-muodosta olisi tekstiksi
muutettuun versioon verrattuna, ainakin jos on pelkästä tekstistä muodostuva
kirja. Nykyiset OCR-ohjelmat ovat kyllä melkoisen hyviä ja nopeita, mitä
itse olen niitä jkv käyttänyt. En usko että ajassakaan säästää, kyllä sivun
ocr-lukeminen verrattuna muuttamiseksi pdf:ksi ja tallentaminen siinä
järkyttävän kömpelössä muodossa on todennäköisesti nopeampaa. Automaattinen
oikoluku löytää suurimman osan virheistä, ja jos originaali on edes
kohtalainen, niin virheprosentti on kuitenkin tasoa <0,1 %. PDF-tiedostoa
että kyllä kämmentietokoneella tai paremmalla kännykällä (joiden kanssa
lukeminen vaikka sängyssä vieruskaveria häiritsemättä on hyvin helppoa) lue
jollet olet todella masokisti.
Hyvä, että palautit aiheen takaisin säikeen lähtökohtaan, koska kyllähän
ocr:äämiselle selvästikin on yhä tilausta pdf:än jo esiin tulleiden
heikkouksien takia.
Ajattelin vain siten päin, että niin kauan kuin ocr-pohjainen kirjojen
dataksi muuntaminen on kohtalaisen hidasta ja työlästä - ja sitä se
todella on, jos se tehdään kunnolla; olen kokeillut jonkin verran - niin
ainakin pääosasta public domainissa olevista suomalaiskirjoista
voitaisiin jo kohtalaisen nopeasti tehdä ne tarvittavat huolelliset
tif-skannaukset. Niistä puolestaan saisi saman tien täysin
ohjelmallisesti täysin virheettömät pdf-filet, jotka kompressoituvat
keskimäärin 10 megan tasolle.
Tuskin pdf-versioiden saataville saattamisesta haittaakaan olisi niin
kauan kuin vastaavien tekstikuvien ocr:ääminen ja oikolukeminen
tarvittavan monta kertaa ja tarvittavan monella tavalla vie joka
tapauksessa vie joitakin vuosia. Se nimittäin on ocr:äämisen ilmeisin
heikkous vielä nykyään, että lopputulos täytyy todella moneen kertaan
varmistaa, jos tuloksen aikoo laittaa julkisesti saataville nettiin.
Pdf:ät ovat siis heti täysin virheettömiä (siinä määrin kuin skannit
ovat), kuin yhteen nivottu nippu datamuotoisia valokopioita, joten ne
ovat myös tulostettavissa A4-nipuksi, jossa sivut ovat täsmälleen
alkuperäisen kirjan kaltaisia. Sellaisena niiden lukeminen käy myös
vuoteessa.
Epäilemättä pitkällä tähtäimellä "muodosta vapaaksi" ocr:ätyllä
tekstillä on enemmän käyttömahdollisuuksia tietoteknisesti, mutta aina
tämän threadin alussa mainittuun suomalaiseen ocr-projektiin (osana
Gutenbergiä) saakka ongelmana onkin ollut lähinnä se, ettei kukaan ole
vaivautunut suomalaista vanhaa kirjallisuutta EDES skannaamaan
minkäänlaiseksi dataksi.
Pdf:äämisen tajuaminen yhdeksi, nopeasti näkyviä tuloksia tuottavaksi
mahdollisuudeksi, voisi saada ainakin skannaamisprosessin jo käyntiin
jossain asiasta kiinnostuneella taholla. Skannaushan on joka tapauksessa
tehtävä.
--
Esa
On sitä. Jo tälläkin hetkellä ovat vapaata riistaa vaikkapa
Juhani Aho, Santeri Alkio, Paavo Cajander, Minna Canth,
Arvid Järnefelt, Uuno Kailas, Aleksis Kivi, Kaarlo Kramsu,
Maiju Lassila, Eino Leino, Hj. Nortamo, Teuvo Pakkala,
J. L. Runeberg, Edith Södergran, Z. Topelius ja sadat ja
sadat ja sadat ja sadat ja taas sadat muut. Kymmenen
vuoden sisällä vapautuvat muun muassa Jalmari Finne, Saima
Harmaja, Maria Jotuni, Volter Kilpi ja Joel Lehtonen.
Vuosina 1963-1967 WSOY julkaisi henkeäsalpaavan upean
antologian "Suomen sana", joka sisälsi ohuen pintaraapaisun
Suomen kansalliskirjallisuudesta -- lyhyinä fragmentteina,
joita on tilanpuutteen vain muutama per kirjoittaja. Sivuja
teoksessa oli yhteensä 14 645. Jos jo tästä saisi public
domainissa olevat osat skannattua, niin olisinpa onnellinen.
--
"I have tried too, in my time, to be a philosopher; but, I don't
know how, cheerfulness was always breaking in." --Oliver Edwards
T P Uschanov tusc...@cc.helsinki.fi +358 (0)40 584 2720
Visit my home page! http://www.helsinki.fi/~tuschano/
>Jos jo tästä saisi public domainissa olevat osat skannattua,
>niin olisinpa onnellinen.
Eiköhän tuo porukalla ja ajan kanssa onnistu!
Valitkaa haluamanne vapaa kirja, skannatkaa aluksi vaikkapa vain
nimiölehden molemmat puolet ja lähettäkää ne minulle (spam-esto
veks!). Sopiva olisi esim. png tai jpeg 150-300 dpi harmaasävynä.
Sitten skannataan koko kirja ja OCR-tunnistetaan teksti sekä tehdään
esim. offline-lukua varten pdf-tiedosto. OCR-ohjelman työhakemisto tai
työtiedosto säilytetään, pdf-muodosta ei ole paljonkaan iloa myöhemmin
konvertointihommissa.
Oikoluetaan kokeneemmin voimin raakateksti ja annetaan tarkistus
jollekin innokkaalle lukuihmiselle, josta koulutetaan pikavauhtia
ensiluokkainen avustaja. Samalla saa lukea juuri ne klassikot, joita
ei ole vielä koskaan ehtinyt mutta olisi pitänyt...
Verkostoitunut, hajautettu työskentelymalli sallii jokaisen tehdä
haluamaansa työtä omassa tahdissa ajan, kykyjen ja laitteiden
sallimissa puitteissa. Tällä tavalla saamme kartutettua
suomalaistenkin nettikirjojen määrän edes ruotsalaisten tasolle :-)
Tapio