Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Suomen Akatemian Sanakirja

69 views
Skip to first unread message

H. Markus Lang

unread,
Nov 13, 2011, 11:09:17 AM11/13/11
to

Suomen kielestä olisi laadittava kunnollinen ja kattava yleis- ja
erikoiskielten sanakirja, joka sisältäisi kaikki kielemme sanat. Tässä
sanakirjassa pitäisi olla ensinnäkin kaikki Nykysuomen sanakirjan
hakusanat, kaikki Kielitoimiston sanakirjan hakusanat, suurin osa Vanhan
kirjasuomen sanakirjan hakusanoista sekä kosolti erikoisalojen -
tieteiden, taiteiden, kaupan, teollisuuden, liikenteen ym. - sanastoa
sekä vakiintuneita puhekielen ja slangin sanoja ja yhdyssanoja. Jos
tällaista sanakirjaa ei pian laadita, ei suomea voi pitää sivistyskielenä.

Tällainen sanakirja voisi olla laajuudeltaan vajaat 500000 hakusanaa, ja
se julkaistaisiin sekä painettuna (n. 6 nidettä) että elektronisena,
päivitettävänä versiona. Sanakirja on taitettava ilmavasti, ikään kuin
Suomessa ei olisi pulaa paperista, ja jokainen hakusana olkoon omana
kappaleenaan.

Tein malliksi pari sivua tällaista sanakirjaa. Otin mallia eri kielten
yksikielisistä sanakirjoista ja yhdistelin parhaita puolia. Näytteeseen
ei ole merkitty sanojen taivutustyyppejä, mutta todennäköisesti
Kielitoimiston sanakirjan merkintätapa voisi toimia tässäkin.

http://www.elisanet.fi/mlang/theeta/sana-a.pdf

Lyhenteiden ja muiden merkintöjen on tarkoitus olla itsestään selviä.
Groteskilla esitetään tausta- ja lisätietoja, kuten sanan etymologia ja
ensiesiintyminen sekä kielenhuolto-ohjeita lähteineen; näiden on
tarkoitus olla mahdollisimman ytimekkäitä, ja kielenhuolto voisi olla
kovasanaisempaa kuin kielitoimistossa. Lause-esimerkkien määrä voisi
olla hiukan pienempi kuin Nykysuomen sanakirjassa mutta laajempi kuin
Kielitoimiston sanakirjassa.

Näytteestä puuttuvat mm. seuraavat sanat:
- aallokkovastus
- aallokkovastuslisä
- aallottua
- aaltoanalyysi
- aaltoimpedanssi
- aaltojännite
- aaltokerroslevy
- aaltolento
- aaltolähtö
- aaltopeltivuoraus
- aaltoratsastaja
- aaltovalo
- aaltovastus.

Otsikko "Suomen Akatemian Sanakirja" on toki viiltävän ironinen. Suomen
Akatemian toimintaedellytyksiä on leikattu niin syvälti, ettei se kykene
enää ikinä toteuttamaan tällaista hanketta, Kotuksesta nyt
puhumattakaan. Sama pätee Suomalaiseen Tiedeakatemiaan. Käytännössä
tällaisen hankkeen voisi toteuttaa jokin suuri kaupallinen kustantamo
yleishyödyllisten säätiöiden tuella, ja se työllistäisi kymmenkunta
ihmistä useaksi vuodeksi.

Suomessa on paljon ihmisiä, jotka itkevät "monikulttuurisuuden" takia ja
vastustavat sitä henkeen ja vereen. Valitettavasti he ovat täysin
innottomia ja saamattomia silloin kun omaa kulttuuria voisi rakentaa.

-----------------------------
ml...@elisanet.fi Alex ska nu ha lite Pippa-ledighet.
http://www.elisanet.fi/mlang/

Jukka K. Korpela

unread,
Nov 13, 2011, 12:09:03 PM11/13/11
to
2011-11-13 18:09, H. Markus Lang kirjoitti:

> Suomen kielestä olisi laadittava kunnollinen ja kattava yleis- ja
> erikoiskielten sanakirja, joka sisältäisi kaikki kielemme sanat.

Tavoite on mahdoton, koska suomen sanojen määrä on ääretön, mutta
sopivasti rajattuna ajatus on järkevä, kannatettava, tarpeellinen ja
teknisesti realistinen. Vaikeampi kysymys on, millä voimalla se
voitaisiin toteuttaa.

Myös tavoitteen tarkentaminen olisi vaikeaa, koska siitä olisi
monenlaisia käsityksiä. Ollakseen hyödyllinen sanakirjan pitäisi olla
sekä kuvaileva että normatiivinen, mutta tästä tai normien sisällöstä
eivät varmaan kaikki olisi samaa mieltä.

> Tässä
> sanakirjassa pitäisi olla ensinnäkin kaikki Nykysuomen sanakirjan
> hakusanat, kaikki Kielitoimiston sanakirjan hakusanat

ym., mutta herää myös kysymys, miten laajasti murteiden sanastoa pitäisi
olla – sitä on koottu aika laajasti eli valmista aineistoa on, mutta sen
saattaminen julkaisukuntoon varsinkin isomman hankkeen osaksi olisi
työlästä.

Vastaan tulisi muun muassa se ongelma, että noihin aineistoihin saattaa
olla voimassa olevia tekijänoikeuksia ja lähioikeuksia, jotka on ehkä
luovutettu kustantajille. Tämä olisi toki ratkaistavissa, jos
poliittista tahtoa olisi – viime kädessä vaikka pakkolunastuksella.

> Tällainen sanakirja voisi olla laajuudeltaan vajaat 500000 hakusanaa, ja
> se julkaistaisiin sekä painettuna (n. 6 nidettä) että elektronisena,
> päivitettävänä versiona.

Oikea menettely olisi mielestäni se, että aineisto julkaistaisiin
verkossa ja annettaisiin kokonaisuudessaan vapaasti käytettäväksi. Jos
kysyntää painetulle versiolle olisi, niin varmaan jokin julkaisija sen
painattaisi. Tämä vastaisi EU:n periaatteita: julkisin varoin tuotettu
aineisto on saatettava vapaaseen käyttöön. Äärimmillään tämä voisi
tarkoittaa jopa sitä, että julkisella rahoituksella vain tuotetaan
aineisto, ja itse kukin saisi julkaista sen verkossa haluamallaan
tavalla. On nähty, että julkiset laitokset eivät tällaisissakaan
asioissa ole kehityksen etulinjassa, vaan näppärä nörtti tekee
helpohkosti paremman käyttöliittymän – jos vain saa aineiston
käytettäväkseen.

> Tein malliksi pari sivua tällaista sanakirjaa.

Kiitettävän aloitteen kiitettävä konkretisointi.

Mallissa on mukana muun muassa etymologisia tietoja, jotka ovat
joillekuille erittäin kiinnostavia, monille taas aivan yhdentekeviä,
jopa häiritseviä. Etymologisten selitysten yksi ongelma on, että niiden
ajatellaan sanelevan, mitä sana ”oikeasti” tarkoittaa – onhan
etymologia-sanakin alkujaan tarkoittanut sanojen oikean merkityksen
tutkimista.

Tällainen aineisto tuotettaisiin joka tapauksessa tietokantana. Jos se
suunnitellaan hyvin, siitä voidaan tuottaa hyvin monipuolisesti
halutunlaisia versioita, jopa täysin henkilökohtaistettuja versioita,
joissa on mukana käyttäjän haluamat tiedot. Lisäksi voidaan tehdä
yksinkertainen perusversio, jossa normaalinäkymässä on tavanomaiset
sanakirjatiedot mutta myös mahdollisuus avata esille vaikka mitä tietoja
(kuten etymologiset tiedot, laajempi esimerkkikokoelma, sanan kaikki
taivutusmuodo, synonyymit, muunkielisiä vastineita jne.).

Erityisen tärkeää olisi saada mukaan englanninkieliset vastineet.
Englanti on nykyajan kansainvälinen yleiskieli, joten se olisi mukana
nykyaikaisessa suomen sanakirjassa yhtä itsestäänselvästi kuin
vanhimmissa sanakirjoissa oli ruotsi, latina tai saksa. Tällaisen
sanakirjan hyödyllisyyshän ei suinkaan rajoittuisi vain suomea
äidinkielenään puhuviin.

> Otsikko "Suomen Akatemian Sanakirja" on toki viiltävän ironinen.

Viiltävyydestä olen vähän eri mieltä. Suomen Akatemia ei ole aikoihin
muistuttanut esimerkiksi Ranskan akatemiaa tai Ruotsin akatemiaa, vaan
se on tutkimusrahoituksen rahanjakolaitos. Varmaankin tarpeellinen,
mutta ei kuulu tähän yhteyteen.

> Käytännössä
> tällaisen hankkeen voisi toteuttaa jokin suuri kaupallinen kustantamo
> yleishyödyllisten säätiöiden tuella, ja se työllistäisi kymmenkunta
> ihmistä useaksi vuodeksi.

Valitettavasti tästä ei voine mitenkään saada kannattavannäköistä
hanketta kaupalliselle toimijalle. Tämä on myös luonteeltaan asia, joka
kuuluisi valtion rahoittaa, jos ajatellaan, että valtiolla ylipäänsä on
tehtäviä kulttuurin alalla. Eri asia on, että tähän tarvittaisiin myös
paljon vapaaehtoisia. Tällainen hanke vaatisi kontrolloidun wikin eli
wiki-tekniikkaa käyttävän järjestelmän, josta kuitenkin otettaisiin
tietoja itse sanakirjaan vain kielen ammattilaisten tekemillä valinnoilla.

Kunhan poliittinen tahto löytyy – mikä voi olla varsin vaikeasti
järjestettävissä –, tehtävä voidaan antaa esimerkiksi Kotimaisten
kielten tutkimuskeskuksesta muodostettavalle laitokselle, jolle voidaan
antaa esimerkiksi perinteinen nimi Kielitoimisto. Kotuksen muut tehtävät
sopii jakaa yliopistoille.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

H. Markus Lang

unread,
Nov 15, 2011, 9:08:08 AM11/15/11
to

Jukka K. Korpela esitti lausunonaan seuraavan:

> Vastaan tulisi muun muassa se ongelma, että noihin aineistoihin saattaa
> olla voimassa olevia tekijänoikeuksia ja lähioikeuksia

Yksi ongelma sanakirjatyössä on se, että sanojen merkitykset on voitava
esittää täsmällisesti ja käytännössä joudutaan hyödyntämään aikaisempia
muotoiluja. Minusta riittää lähteen (tekijän) mainitseminen siten kuin
sanakirjatyössä yleisesti on tapana.

> Oikea menettely olisi mielestäni se, että aineisto julkaistaisiin
> verkossa ja annettaisiin kokonaisuudessaan vapaasti käytettäväksi. Jos
> kysyntää painetulle versiolle olisi, niin varmaan jokin julkaisija sen
> painattaisi. Tämä vastaisi EU:n periaatteita: julkisin varoin tuotettu
> aineisto on saatettava vapaaseen käyttöön.

En usko tällaista sanakirjaa nykytilanteessa saatavan aikaan julkisilla
varoilla. Kotus on joutunut rajoittamaan kahta sanakirjahanketta.
"Vanhan kirjasuomen sanakirjahanke keskeytetään, sillä Kotuksella ei ole
voimavaroja [lue: sille ei haluta myöntää voimavaroja] laatia kaikkia
pitkäkestoisia sanakirjoja niiden kulttuuriarvosta huolimatta."

http://www.minedu.fi/OPM/Julkaisut/2010/Kotuksen_tehtavat.html

Lähinnä WSOY:n sanakirjatoimituksessa voisi olla osaamista ja
voimavaroja tällaisen hankkeen toteuttamiseen säätiöiden tuella.
Laajuudeltaanhan tämä olisi vain noin 4:jä kappaletta WSOY:n Saksa -
suomi-suursanakirjaa (2008).

Työssä voitaisiin kuitenkin hyödyntää Kotuksen sanastokeräelmiä ja
sanalippuja.

Niinpä sanakirja olisi kaupallinen tuote ja ostettavissa kohtuuhintaan.
Painetulla laitoksella olisi varmasti kysyntää paitsi Suomessa myös
ulkomailla - se hankittaisiin erittäin moneen yliopistokirjastoon ympäri
maailman.

> Mallissa on mukana muun muassa etymologisia tietoja, jotka ovat
> joillekuille erittäin kiinnostavia, monille taas aivan yhdentekeviä,
> jopa häiritseviä.

Elektronisessa aineistossa ne voi sulkea näkyvistä yhdellä valinnalla.
Minä en kyllä pysty suurin surminkaan asettumaan sellaisen lukijan
asemaan, jota sanan etymologian selitys häiritsisi, koska itse haluan
sen ensimmäiseksi sanakirjasta löytää.

> Etymologisten selitysten yksi ongelma on, että niiden
> ajatellaan sanelevan, mitä sana "oikeasti" tarkoittaa - onhan
> etymologia-sanakin alkujaan tarkoittanut sanojen oikean merkityksen
> tutkimista.

Ainakaan minä en sellaisesta harhakuvitelmasta kärsi. Ulkomaisissa
sanakirjoissa etymologian osoittaminen on niin usein tapana, että se
tarvitaan tässäkin. Varsinainen etymologinen sanakirja olkoon erikseen.

> Erityisen tärkeää olisi saada mukaan englanninkieliset vastineet.

En pidä tätä yksikielisen sanakirjan tehtävänä. Suomalaisista
sanakirjoista noin menettelee tietääkseni ainoastaan "Oikeeta suomee".

-----------------------------
ml...@elisanet.fi
http://www.elisanet.fi/mlang/

Jukka K. Korpela

unread,
Nov 15, 2011, 10:25:43 AM11/15/11
to
2011-11-15 16:08, H. Markus Lang kirjoitti:

> Jukka K. Korpela esitti lausunonaan seuraavan:
>
>> Vastaan tulisi muun muassa se ongelma, että noihin aineistoihin saattaa
>> olla voimassa olevia tekijänoikeuksia ja lähioikeuksia
>
> Yksi ongelma sanakirjatyössä on se, että sanojen merkitykset on voitava
> esittää täsmällisesti ja käytännössä joudutaan hyödyntämään aikaisempia
> muotoiluja. Minusta riittää lähteen (tekijän) mainitseminen siten kuin
> sanakirjatyössä yleisesti on tapana.

Sanakirjoissa ei ole tapana mainita lähteitä kuin ylimalkaisesti. Jos
vedottaisiin siihen, että käyttö on sallittua sitaattioikeuden nojalla,
olisi sekä lähteen että tekijöiden mainitseminen (kunkin sitaatin osalta
erikseen) nykyisen tekijänoikeusdirektiivin ja -lain mukaan aina pakollista.

Sen sijaan on sanakirjatyössä tapana katsoa, että aiempien sanakirjojen
hyödyntäminen myös ottamalla niistä tekstiä sellaisenaan on sallittua,
koska sanat itsessään eivät ole tekijänoikeuden kohteena ja koska
sanojen selitykset taas eivät yleensä ylitä teoskynnystä. Tämä tulkinta
voitaisiin kyseenalaistaa, mutta se ei nyt ole olennaista. Se on joka
tapauksessa vallitseva käytäntö, ja useimpien sanakirjojen sisällöstä
valtaosa on kopioitu muista sanakirjoista. Ei ole sattumaa, että
esimerkiksi Suomessa julkaistuissa lukemattomissa sivistyssanakirjoissa
sanojen selitykset ovat usein sanatarkasti ja jopa kirjoitusvirheitä
myöten samat.

Ongelma syntyy kuitenkin aineiston massakäytöstä. Suomen kielen
sanakirjan tekeminen olisi luonnollista aloittaa saattamalla Nykysuomen
sanakirja tietokantamuotoon ja yhdistämällä siihen muita valmiita
aineistoja, minkä jälkeen sitä ruvettaisiin käymään kriittisesti läpi ja
täydentämään. Kokonaisuudessaan Nykysuomen sanakirja epäilemättä ylittää
teoskynnyksen kirkkaasti, tehtiinhän sitä laadittaessa suuri määrä
luovaa työtä aineiston valinnassa ja muokkaamisessa. Asia on myös
erikseen arvioitu tekijänoikeusneuvostossa, jonka mukaan kyseessä on
”itsenäinen ja omaperäinen teos” eli teos tekijänoikeudellisessa
mielessä; ks.
http://www.minedu.fi/export/sites/default/OPM/Tekijaenoikeus/tekijaenoikeusneuvosto/tekijaenoikeusneuvoston_lausunnot/2009/TN_2009_10.pdf

Nykysuomen sanakirjan tekijänoikeuden haltijoiden selvittäminen ei liene
ihan yksinkertaista.

Tämä ei estä sen aineiston käyttämistä. Onhan sitä jo käytetty
Perussanakirjan ja Kielitoimiston sanakirjan teossa, ja ne ovat lähinnä
Nykysuomen sanakirjan supistettuja laitoksia, joihin on lisätty uudempaa
aineistoa. Tiedossani ei ole, millaisia sopimuksia tai yhteisymmärrys
tämän takana on.

Myös kyseisiin uudempiin sanakirjoihin liittyy tekijänoikeuskysymyksiä,
ja niiden osalta intressit ovat ehkä toisensuuntaisia ja niihin
vaikuttavat myös Kotuksen ja kustantajien väliset sopimukset. Nykyisin
kustantajat ovat aika tiukkoja sopimustekstejä kirjoittaessaan.

>> Oikea menettely olisi mielestäni se, että aineisto julkaistaisiin
>> verkossa ja annettaisiin kokonaisuudessaan vapaasti käytettäväksi. Jos
>> kysyntää painetulle versiolle olisi, niin varmaan jokin julkaisija sen
>> painattaisi. Tämä vastaisi EU:n periaatteita: julkisin varoin tuotettu
>> aineisto on saatettava vapaaseen käyttöön.
>
> En usko tällaista sanakirjaa nykytilanteessa saatavan aikaan julkisilla
> varoilla.

Minä taas en osaa nähdä, miten sitä voitaisiin saada aikaan muuten kuin
pääosin julkisilla varoilla, ja silloin parasta tehdä se kokonaan
julkisilla varoilla, jolloin se voidaan antaa vapaaseen käyttöön.
Tällaisen sanakirjan tekeminen ei olisi kaupallisesti kannattavaa,
varsinkaan kun se joutuisi kilpailemaan nykyisten sanakirjojen kanssa.

> Kotus on joutunut rajoittamaan kahta sanakirjahanketta.
> "Vanhan kirjasuomen sanakirjahanke keskeytetään, sillä Kotuksella ei ole
> voimavaroja [lue: sille ei haluta myöntää voimavaroja] laatia kaikkia
> pitkäkestoisia sanakirjoja niiden kulttuuriarvosta huolimatta."

Voi myös kysyä, onko toimittu oikein, kun rahat on käytetty vanhan
kirjasuomen ja suomen murteiden sanakirjan kaltaisiin teoksiin eikä
kattavaan ja maksutta jaettavaan suomen yleiskielen sanakirjaan.
Veronmaksajien valtaenemmistön kanta olisi varmaankin aika selvä.

Sanakirjojen tekeminen tutkimuksen käyttöön on toki ollut oikea valinta,
jos Kotimaisten kielten tutkimuskeskus mielletään nimenomaan
tutkimuskeskukseksi. Mutta toisaalta sille on hankittu rahaa ja
arvovaltaa sillä, että se selitetään kielenhuoltolaitokseksi. Tämä
ristiriita on Kotuksen perusongelma, joka johtuu Paavo Väyrysen suuresta
lehmänkaupasta, joka juhlapuheissa on esitetty hänen valtiomiestekonaan.

> Lähinnä WSOY:n sanakirjatoimituksessa voisi olla osaamista ja
> voimavaroja tällaisen hankkeen toteuttamiseen säätiöiden tuella.

Pelkäänpä, että voimavaratkaan eivät riittäisi. Mutta voimavaroja ja
osaamista saa toki rahalla. Ongelmana on, että tällaisesta tuskin saisi
aikaan edes vakavasti otettavaa ehdotusta kaupalliseksi hankkeeksi eli
nykysuomeksi bisneskeissiä (engl. business case).

> Laajuudeltaanhan tämä olisi vain noin 4:jä kappaletta WSOY:n Saksa -
> suomi-suursanakirjaa (2008).

Pelkäänpä, että aliarvioit työmäärän moninkertaisesti. Ehkä et ollutkaan
ihan tosissasi – tähän vihjaisi huuhaattinen kirjoitusasu ”4:jä”, jota
epäilen tarkoitukselliseksi. Ja suursanakirjojen aineistohan on olemassa
valmiina muodossa, josta se voidaan suoraan tulostaa.

> Työssä voitaisiin kuitenkin hyödyntää Kotuksen sanastokeräelmiä ja
> sanalippuja.

Mahdollisesti, jos Kotus sallisi.

> Niinpä sanakirja olisi kaupallinen tuote ja ostettavissa kohtuuhintaan.

Tuohon on vaikea uskoa, kun Kielitoimiston sanakirjaakaan ei enää
julkaista painettuna vaan vain ”sähköisenä versiona”, johon saa vain
vuosilisenssin aika suolaiseen hintaan. Sen aineisto sentään on
olemassa, joten suurin piirtein vain myydään jo tehtyä tuotetta, vieläpä
verkkoversiona, jolloin cd:n tuotantokustannuksetkin jäävät pois.

> Painetulla laitoksella olisi varmasti kysyntää paitsi Suomessa myös
> ulkomailla - se hankittaisiin erittäin moneen yliopistokirjastoon ympäri
> maailman.

Mahdollisesti. Riippuu hinnasta ja kirjastojen määrärahoista. Mutta
vähintään tuhat kertaa suurempi määrä ihmisiä käyttäisi sitä, jos se
olisi netissä vapaana.

>> Mallissa on mukana muun muassa etymologisia tietoja, jotka ovat
>> joillekuille erittäin kiinnostavia, monille taas aivan yhdentekeviä,
>> jopa häiritseviä.
>
> Elektronisessa aineistossa ne voi sulkea näkyvistä yhdellä valinnalla.

Mutta ei painetussa.

> Minä en kyllä pysty suurin surminkaan asettumaan sellaisen lukijan
> asemaan, jota sanan etymologian selitys häiritsisi, koska itse haluan
> sen ensimmäiseksi sanakirjasta löytää.

Useimmiten sanakirjaa ainakin työkäytössä käytetään niin, että
etymologiat vain häiritsevät. Etymologioilla on oma viihdearvonsa, ja
siksi niiden on hyvä olla saatavilla. Suomen kielen etymologisten
sanakirjojen selitysten lisääminen olisi hyvä ajatus tämän takia ja myös
tutkimuksen tarpeisiin, mutta niiden tulisi olla erikseen valittavissa
(erityyppisinä ja -tasoisina – tieteellisen etymologisen sanakirjan
normaali esitystapa on tavalliselle lukijalle ihan hepreaa).

>> Etymologisten selitysten yksi ongelma on, että niiden
>> ajatellaan sanelevan, mitä sana "oikeasti" tarkoittaa - onhan
>> etymologia-sanakin alkujaan tarkoittanut sanojen oikean merkityksen
>> tutkimista.
>
> Ainakaan minä en sellaisesta harhakuvitelmasta kärsi.

Ehkäpä et, mutta tavoitteena pitäisi olla sanakirja, jota ainakin 90 %
suomalaisista voi käyttää sujuvasti. Ja silloin on merkitystä myös
yleisillä harhakäsityksillä.

> Ulkomaisissa
> sanakirjoissa etymologian osoittaminen on niin usein tapana, että se
> tarvitaan tässäkin.

Huono perustelu hyvälle asialle.

> Varsinainen etymologinen sanakirja olkoon erikseen.

Ei, vaan etymologinen aineisto olisi kytkettävä yleissanakirjaan. Vain
siten saadaan etymologiatiedon vakavan hyödyntämisen vaatima perusta.
Sellaisessa käytössä on tiedettävä etymologioiden luotettavuudesta,
kilpailevista teorioista – sen sijaan, että esitettäisiin Veijo Meren
”Sanojen synnyn” kaltaista yleistajuista esitystä, joka on lyhyehköä,
luettavaa, kiinnostavaa ja ihan soopaa. (Ihan soopaa se on, koska siihen
on tehosekoittimella sotkettu hyvin perusteltuja selityksiä, hyviä mutta
epävarmoja teorioita ja Meren omia sepitelmiä.)

>> Erityisen tärkeää olisi saada mukaan englanninkieliset vastineet.
>
> En pidä tätä yksikielisen sanakirjan tehtävänä. Suomalaisista
> sanakirjoista noin menettelee tietääkseni ainoastaan "Oikeeta suomee".

Toisen kielen käyttö apuna selitysten esittämisessä on erittäin
hyödyllistä, ja siksi sitä aiemmin harrastettiinkin yleisesti. Ei ole
mitenkään haitaksi, vaikka sanakirjasta samalla tulee käyttökelpoinen
kaksikielinen sanakirja.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

Jukka K. Korpela

unread,
Nov 15, 2011, 10:53:49 AM11/15/11
to
2011-11-13 18:09, H. Markus Lang kirjoitti:

> Näytteestä puuttuvat mm. seuraavat sanat:
– –
> - aaltoanalyysi
> - aaltoimpedanssi

Ja tuosta välistä aaltofunktio, joka on paljon olennaisempi sana
(modernin fysiikan keskeisiä termejä) kuin monet aalto-alkuiset
tilapäismuodosteen tapaiset sanat kuten ”aaltotukkainen”. Mainitsen
tämän siksi, että se osoittaa, miten helposti keskeisiäkin sanoja jää pois.

Suomen kielelle on olemassa melko hyvää analysointiohjelmistoa, jolla
voitaisiin käsitellä tehokkaasti suuria määriä aineistoja, kunhan ne
ovat digitaalisessa muodossa. Näin selville saatavat uudet sanat voivat
olla ”kertakäyttösanoja”, jotka suomenpuhuja ymmärtää mutta joita ei
välttämättä ole koskaan aiemmin käytetty – kielen potentiaalista
sanavarastoa, joka yhtäkkiä aktualisoituu. Tällainen voisi olla vaikkapa
”aaltotukkaistuminen”. Olisi hyvä kerätä myös tällaiset tiedot, vaikka
niitä ei näytettäisikään sanakirjan normaalinäkymässä.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

Jukka K. Korpela

unread,
Dec 3, 2011, 4:10:51 PM12/3/11
to
2011-11-13 18:09, H. Markus Lang kirjoitti:

> Suomen kielestä olisi laadittava kunnollinen ja kattava yleis- ja
> erikoiskielten sanakirja, joka sisältäisi kaikki kielemme sanat.

”Kotus-blogissa” on nyt esitetty samansuuntainen joskin kovin vaatimaton
ajatus:

”Muuten olen sitä mieltä, että olisi vallan mahtavaa, jos Nykysuomen
sanakirja saataisiin kaikkien netinkäyttäjien ulottuville verkkoon.
Eiköhän laadita ainakin adressi aiheesta?”
http://www.kotus.fi/?5400_m=9335&s=3235

Nykysuomen sanakirjan paneminen nettiin olisi ehkä ollut kulttuuriteko
noin vuonna 1995. Nyt se tuntuu lähinnä koomiselta ajatukselta ja jopa
kyseenalaiselta, jos todella tehtäisiin vain se ja käytettäisiin nimeä
”Nykysuomen sanakirja”. Kansa luultavasti luulisi, että kyseessä on
päivitetty versio – luuleehan moni ostaneensa NS:n melko uudenkin
version, kuvitellen painovuoden merkitsevän jotain sisällön kannalta.
Siksi olen ottanut tavakseni muistuttaa, että kyse on lähinnä 1930- ja
1940-luvun agraarisuomen sanakirjasta, jossa on hiukan 1950-luvun uutta
sanastoa mukana.

Muuten, jos tekee mieli kommentoida ”Kotus-blogissa” tätä tai muuta
asiaa, kannattaa ottaa huomioon, että sen etusivun lausuma ”Viestisi
julkaistaan, kunhan ne eivät riko lakeja eivätkä ole eettisesti tai
muuten epäilyttäviä” ei pidä paikkaansa. Todellisuudessa sen toimitus
julkaisee tai ei julkaise viestejä, kriteerejä kertomatta.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

H. Markus Lang

unread,
Dec 5, 2011, 9:36:20 AM12/5/11
to

Jukka K. Korpela esitti lausuntonaan seuraavan:

> Sanakirjoissa ei ole tapana mainita lähteitä kuin ylimalkaisesti. Jos
> vedottaisiin siihen, että käyttö on sallittua sitaattioikeuden nojalla,
> olisi sekä lähteen että tekijöiden mainitseminen (kunkin sitaatin osalta
> erikseen) nykyisen tekijänoikeusdirektiivin ja -lain mukaan aina
> pakollista.

Elektronisessa laitoksessa se olisi helppoa, painetussa laitoksessa
kömpelömpää. Nykysuomen sanakirjassa on lause-esimerkkien kohdalla
ainoastaan kirjoittajan sukunimi. Ulkomaalaisissa sanakirjoissa on
joskus yksityiskohtaisemmatkin merkinnät.

> Sen sijaan on sanakirjatyössä tapana katsoa, että aiempien sanakirjojen
> hyödyntäminen myös ottamalla niistä tekstiä sellaisenaan on sallittua,
> koska sanat itsessään eivät ole tekijänoikeuden kohteena ja koska
> sanojen selitykset taas eivät yleensä ylitä teoskynnystä.

Tämä on hyvä tietää.

> Kokonaisuudessaan Nykysuomen sanakirja epäilemättä ylittää
> teoskynnyksen kirkkaasti

Siksi WSOY:llä olisi parhaat edellytykset uuden "supersanakirjan"
laatimiseen, koska julkaisuoikeudet lienevät sillä jo valmiina.

> Nykysuomen sanakirjan tekijänoikeuden haltijoiden selvittäminen ei liene
> ihan yksinkertaista.

Kaikkien työhön osallistuneiden nimet on mainittu sanakirjan
alkusivuilla. Perillisten selvittäminen voi kuitenkin olla työlästä,
mutta siksihän meillä on yksityisetsiviä.

>> En usko tällaista sanakirjaa nykytilanteessa saatavan aikaan julkisilla
>> varoilla.
>
> Minä taas en osaa nähdä, miten sitä voitaisiin saada aikaan muuten kuin
> pääosin julkisilla varoilla

Meillä on Suomessa ollut porvarihallitus, joka haluaa ajaa Suomen
tasavallan ns. alas huojentamalla jatkuvasti rikkaiden verotusta.
Valtiolla ei ole enää varaa poliiseihin eikä sanakirjoihin
(valtionhallinnon "tuottavuusohjelma"). Sivistystyössä joudutaan yhä
useammin turvautumaan kerjuusauvaan. Viimeksi tänään saimme Erkon
lörtsystä lukea, että Koneen Säätiö maksaa Vanhan kirjasuomen sanakirjan
ja Suomen murteiden sanakirjan toimittamisen, koska kokoomukselaiset,
nuo reaalitalouden Roope Ankat, ovat sairaalloisen allergisia veronmaksulle.

> Voi myös kysyä, onko toimittu oikein, kun rahat on käytetty vanhan
> kirjasuomen ja suomen murteiden sanakirjan kaltaisiin teoksiin

Voi kysyä, ja vastaus on selvästi kyllä. Tosin ei niihin ole kaikkia
rahoja pantu.

> Veronmaksajien valtaenemmistön kanta olisi varmaankin aika selvä.

Vox populi vox dei? Kun tyhmälistöltä kysyy, on vastaus takuuvarmasti tyhmä.

> Mutta toisaalta sille on hankittu rahaa ja
> arvovaltaa sillä, että se selitetään kielenhuoltolaitokseksi.

Sellainen selitys ei perustu ainakaan lakitekstiin.

>> Lähinnä WSOY:n sanakirjatoimituksessa voisi olla osaamista ja
>> voimavaroja tällaisen hankkeen toteuttamiseen säätiöiden tuella.
>
> Pelkäänpä, että voimavaratkaan eivät riittäisi. Mutta voimavaroja ja
> osaamista saa toki rahalla.

Kyllä Suomessa rahaa piisaa. Sitä vain ei haluta antaa julkiselle
vallalle. Olisihan se ikävää, jos esimerkiksi poliisilla olisi
riittävästi voimavaroja talousrikosten selvittämiseen. Nyt saa rauhassa
ananasta ahmia ja hotkaista pyyn.

> Ongelmana on, että tällaisesta tuskin saisi
> aikaan edes vakavasti otettavaa ehdotusta kaupalliseksi hankkeeksi eli
> nykysuomeksi bisneskeissiä (engl. business case).

Watch me... *käärii hihat*

>> Laajuudeltaanhan tämä olisi vain noin 4:jä kappaletta WSOY:n Saksa -
>> suomi-suursanakirjaa (2008).
>
> Pelkäänpä, että aliarvioit työmäärän moninkertaisesti.

Arvioin ainoastaan sivumäärää.

>> Työssä voitaisiin kuitenkin hyödyntää Kotuksen sanastokeräelmiä ja
>> sanalippuja.
>
> Mahdollisesti, jos Kotus sallisi.

En näe, kuinka Kotus voisi de jure estää ketään käyttämästä
sanastokeräelmiään. (Hallintoriita!)

> Mahdollisesti. Riippuu hinnasta ja kirjastojen määrärahoista. Mutta
> vähintään tuhat kertaa suurempi määrä ihmisiä käyttäisi sitä, jos se
> olisi netissä vapaana.

En osaa arvostaa ihmisä, joiden pitää saada kaikki heti ilmaiseksi
intternetistä. He eivät kunnioita työtä. Useimmat laatusanakirjat (esim.
Oxford English Dictionary) ovat maksullisia, mutta ilmaisiakin löytyy
(mm. Eesti keele seletav sõnaraamat). Joistakin saa ilmaiseksi
perusaineiston (mm. Merriam - Webster); ehkä tällainen ratkaisu sopisi
meillekin.

> Useimmiten sanakirjaa ainakin työkäytössä käytetään niin, että
> etymologiat vain häiritsevät.

Siksi olenkin esittänyt niitä mahdollisimman suppeasti ja eri fontilla,
niin että ne on haluttaessa helppoa sivuuttaa. Tietokirjan ei pitäisi
vaieta näin olennaisista tosiasioista.

>> Ainakaan minä en sellaisesta harhakuvitelmasta kärsi.
>
> Ehkäpä et, mutta tavoitteena pitäisi olla sanakirja, jota ainakin 90 %
> suomalaisista voi käyttää sujuvasti. Ja silloin on merkitystä myös
> yleisillä harhakäsityksillä.

Kaikkea voidaan "lukea väärin", joko tahallaan tai ymmärtämättömyydestä.
Jossain kohden supersanakirjantekijänkin vastuu päättyy.

>> Varsinainen etymologinen sanakirja olkoon erikseen.
>
> Ei, vaan etymologinen aineisto olisi kytkettävä yleissanakirjaan.

On mahdotonta kuvitella, että esimerkiksi "Atomi ja missi" -sanakirjan
laajat selitykset ympättäisiin Suomen kielen supersanakirjaan. Lähinnä
sen hakusanat voitaisiin osoittaa supersanakirjasta jotenkin.

>> En pidä tätä yksikielisen sanakirjan tehtävänä. Suomalaisista
>> sanakirjoista noin menettelee tietääkseni ainoastaan "Oikeeta suomee".
>
> Toisen kielen käyttö apuna selitysten esittämisessä on erittäin
> hyödyllistä, ja siksi sitä aiemmin harrastettiinkin yleisesti.

Kummallista, että siitä on sittemmin paljolti luovuttu. Ja mitä hyötyä
olisi siitä, että jokin perisuomalainen käsite, kuten "työttömyysturvan
peruspäiväraha" tai "mämmi" esitettäisiin myös jollain vieraalla
kielellä suomenkielistä tiedontarvitsijaa varten?

> Ei ole
> mitenkään haitaksi, vaikka sanakirjasta samalla tulee käyttökelpoinen
> kaksikielinen sanakirja.

Miksi vain kaksikielinen? Mikä olisi se toinen kieli? (Ehdottaisin
saamea. Ei, esperantoa! Ja klingoniakin!)

-----------------------------
ml...@elisanet.fi
http://www.elisanet.fi/mlang/

H. Markus Lang

unread,
Dec 5, 2011, 9:47:00 AM12/5/11
to

Jukka K. Korpela esitti lausuntonaan seuraavan:

> "Kotus-blogissa" on nyt esitetty samansuuntainen joskin kovin vaatimaton
> ajatus:
>
> "Muuten olen sitä mieltä, että olisi vallan mahtavaa, jos Nykysuomen
> sanakirja saataisiin kaikkien netinkäyttäjien ulottuville verkkoon.
> Eiköhän laadita ainakin adressi aiheesta?"

Sanon suoraan, että tuo on kyllä ihan saatanan typerä ajatus. Nykysuomen
sanakirja teoksena on yksityistä omaisuutta. Ei toisten omaa voi noin
vain ruveta adressilla vaatimaan julkiseen käyttöön.

"Olisi vallan mahtavaa, jos me kaikki saataisiin Alepan ruokatavarat
ilmaiseksi! Eiköhän laadita ainakin adressi aiheesta."

Jospa kuitenkin odotellaan, että Helsingin edustalta löytyy öljyä
muualta kuin tankkereista.

> Muuten, jos tekee mieli kommentoida "Kotus-blogissa" tätä tai muuta
> asiaa, kannattaa ottaa huomioon, että sen etusivun lausuma "Viestisi
> julkaistaan, kunhan ne eivät riko lakeja eivätkä ole eettisesti tai
> muuten epäilyttäviä" ei pidä paikkaansa. Todellisuudessa sen toimitus
> julkaisee tai ei julkaise viestejä, kriteerejä kertomatta.

Onneksi täällä saa päästellä höyryjä.

-----------------------------
ml...@elisanet.fi
http://www.elisanet.fi/mlang/

Jukka K. Korpela

unread,
Dec 6, 2011, 7:20:15 PM12/6/11
to
2011-12-05 16:36, H. Markus Lang kirjoitti:

>> Kokonaisuudessaan Nykysuomen sanakirja epäilemättä ylittää
>> teoskynnyksen kirkkaasti
>
> Siksi WSOY:llä olisi parhaat edellytykset uuden "supersanakirjan"
> laatimiseen, koska julkaisuoikeudet lienevät sillä jo valmiina.

En tunne siitä tehtyjä sopimuksia, mutta pidän todennäköisenä, että
sopimukset – sikäli kuin niitä on edes nimenomaisesti tehty – ovat
sisältäneet tekijänoikeuden täydellisen luovutuksen tai edes
rajoittamattoman julkaisuoikeuden. Viime vuosina kustannusyhtiöt ovat
pyrkineet hankkimaan itselleen julkaisuoikeudet, jotka kattavat kaikki
mahdolliset julkaisutavat, mutta sellaista ei ymmärrettävistä syistä
harrastettu 1950-luvulla.

>> Voi myös kysyä, onko toimittu oikein, kun rahat on käytetty vanhan
>> kirjasuomen ja suomen murteiden sanakirjan kaltaisiin teoksiin
>
> Voi kysyä, ja vastaus on selvästi kyllä. Tosin ei niihin ole kaikkia
> rahoja pantu.

Muodollinen totaaliobjekti on tunnetusti usein paljoksuva eikä
merkitykseltään kirjaimellisesti totaalinen. Olennaista on se, että kun
rahoja on rajallinen määrä, johonkin käytetty on jostakin pois. Siksi
sopii kysyä, kannattaako käyttää resursseja sellaiseen, josta ehkä yksi
ihminen tuhannesta voisi periaatteessa olla kiinnostunut, kun puuttuu
sellaista, mitä liki jokainen tarvitsisi ja hyvin moni haluaisi:
ajantasainen verkossa oleva suomen nykyisen yleiskielen sanakirja.

> Kyllä Suomessa rahaa piisaa. Sitä vain ei haluta antaa julkiselle
> vallalle.

Ei haluta antaa, mutta se ottaa pakolla; sitä kutsutaan ”verotukseksi”.
Ja siitä annetaan esimerkiksi Kotukselle summa, jolla voi tehdä
kaikenlaista. Ei kaikkea, mutta aika paljon. Jos summaa pienennetään,
pitäisi entistä tarkemmin miettiä, mitä sillä tehdään.

>>> Työssä voitaisiin kuitenkin hyödyntää Kotuksen sanastokeräelmiä ja
>>> sanalippuja.
>>
>> Mahdollisesti, jos Kotus sallisi.
>
> En näe, kuinka Kotus voisi de jure estää ketään käyttämästä
> sanastokeräelmiään. (Hallintoriita!)

Ei sen tarvitsisi erikseen estää; riittäisi, että se ei päästä
käyttämään niitä. Sanastokeräelmiä tuskin voi selittää julkisiksi
asiakirjoiksi. Lisäksi aineistoa suojaa tekijänoikeuslain mukainen
luettelosuoja (ja siltä osin kuin se on tietokoneella luettavassa
muodossa myös tietokantasuoja).

>> Mahdollisesti. Riippuu hinnasta ja kirjastojen määrärahoista. Mutta
>> vähintään tuhat kertaa suurempi määrä ihmisiä käyttäisi sitä, jos se
>> olisi netissä vapaana.
>
> En osaa arvostaa ihmisä, joiden pitää saada kaikki heti ilmaiseksi
> intternetistä.

Tosiasia kuitenkin on, että maksullisuus vähentää olennaisesti
käyttäjämääriä. En ymmärrä ihmisiä, joiden mielestä maksullisuus on
itsetarkoitus. Jos jotakin toimintaa ei saada liiketaloudellisesti
kannattavaksi, pitää arvioida ennakkoluulottomasti, onko täysi julkinen
rahoitus parempi kuin sekamuoto.

> Useimmat laatusanakirjat (esim.
> Oxford English Dictionary) ovat maksullisia,

Vaihtelee. Maksullisuuden merkitykseen vaikuttaa olennaisesti myös
hinta, ja esimerkiksi englanninkielisessä maailmassa kirjojen yleinen
hintataso on kysyntämäärien takia muuta kuin suomenkielisessä.

>> Useimmiten sanakirjaa ainakin työkäytössä käytetään niin, että
>> etymologiat vain häiritsevät.
>
> Siksi olenkin esittänyt niitä mahdollisimman suppeasti ja eri fontilla,
> niin että ne on haluttaessa helppoa sivuuttaa. Tietokirjan ei pitäisi
> vaieta näin olennaisista tosiasioista.

Etymologiat eivät ole tosiasioita vaan hypoteeseja, joskus vahvasti
perusteltuja, usein heikosti. Niiden esittäminen suppeasti on usein
pahin vaihtoehto, koska suppeus johtaa helposti ns. yhden totuuden
periaatteeseen, ja sellainen ehdottomuus taas ruokkii harhaa siitä, että
etymologia kertoo sanan ”oikean merkityksen”.

>> Ei, vaan etymologinen aineisto olisi kytkettävä yleissanakirjaan.
>
> On mahdotonta kuvitella, että esimerkiksi "Atomi ja missi" -sanakirjan
> laajat selitykset ympättäisiin Suomen kielen supersanakirjaan. Lähinnä
> sen hakusanat voitaisiin osoittaa supersanakirjasta jotenkin.

”Atomi ja missi” on muistaakseni lähinnä viihdyttäväksi tarkoitettu
kooste – ei etymologista aineistoa, vaan sitä hyödyntäen tehty tuote.
Eikä kytkeminen tarkoita samaa kuin sisällyttäminen, vaan se voi merkitä
myös viittauksia. Jos nykyisin haluaa tietää jonkin suomen sanan
etymologiasta, on katsottava muutamasta varsinaisesta etymologisesta
sanakirjasta ja useasta muusta lähteestä, vaikka haluaisi ottaa huomioon
vain tieteellisessä mielessä vakavasti esitetyt selitykset.

>> Ei ole
>> mitenkään haitaksi, vaikka sanakirjasta samalla tulee käyttökelpoinen
>> kaksikielinen sanakirja.
>
> Miksi vain kaksikielinen? Mikä olisi se toinen kieli? (Ehdottaisin
> saamea. Ei, esperantoa! Ja klingoniakin!)

Tuskinpa kenellekään on epäselvää, mikä on nykyisen maailman
kansainvälinen yleiskieli tieteen, tekniikan, talouden ja viestinnän
alalla. Tätä ilmiötä saa tietysti vapaasti vastustaa, mutta
vastustajilla ei yleensä ole ollut tapana esittää rakentavia
vaihtoehtoja – silloinkin, kun mitään vaihtoehtoja yleensä esitetään, ne
ovat olleet realistisuudeltaan enintään saamen ja esperanton tasolla.
Jos englannin ylivalta joskus murtuu, sen murtaa (ja tilalle tuo jonkin
toisen kielen) rahan tai aseiden mahti, eivät kielipoliittiset ohjelmat.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

Jorma Moll

unread,
Dec 7, 2011, 2:21:51 AM12/7/11
to
On 5 joulu, 16:36, "H. Markus Lang" <markus.l...@elisanet.fi> wrote:



>..... mutta ilmaisiakin löytyy (mm. Eesti keele seletav sõnaraamat).....

Kiitokset vinkistä.
Laitoin tuon bookmarkkeihin
0 new messages