Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Montako sanaa maailmassa?

185 views
Skip to first unread message

Sampo Smolander

unread,
Oct 26, 2002, 10:27:14 AM10/26/02
to
Montako sanaa mahtaa olla maailmassa olemassa?
Siis kaikkien kielten kaikka sanat yhteensä.

Arvio: <http://www.oed.com/public/inside/funfacts.htm> kertoo,
että Oxford English dictionaryssä on noin 300 000 sanaa.
("Number of main entries").

<http://www.zompist.com/numbers.shtml> kertoo, että maailmassa
on vähintää 4000 kieltä.

Jos arvioin, että 300 000 kertaa 4000 = 1 200 000 000 sanaa,
niin mahtaako mennä pahasti metsään?

(Tausta: Tolkienin juuri suomennetussa kirjassa "Puu ja lehti"
J.R.R.T. vertaa satujen, kielten ja ihmisen kehityksen mutkikkuutta.
Vertailu on tietysti hankala laittaa tukevalle pohjalle, mutta kielten
ja ihmisen biologisen kehityshistorian mutkikkuutta verratessa
tulimieleen, että sanojen määrää voisi verrata ihmisen geenien määrään tai
ehkä paremminkin eri geenialleelien määrään)

--
Sampo Smolander at Helsinki Fi..http://www.cs.helsinki.fi/~ssmoland/
"Grandmothers gave birth to the human race simply by refusing to die
when their ovaries did." - Kristen Hawkes

Sampo Smolander

unread,
Oct 26, 2002, 11:16:38 AM10/26/02
to
Jukka K. Korpela <jkor...@cs.tut.fi> wrote:
>> Montako sanaa mahtaa olla maailmassa olemassa?
> Määrittele, mitä tarkoitat olemassaololla. Onko suomen kielessä sana
> "höyryturbiiniveli"? (Sitä _on_ käytetty, jutussa, jossa esimerkkinä oli
> juuri se, että suomen kielen sanojen määrää ei voida määrittää, koska
> yhdyssanoja - ja johdoksiakin - voidaan muodostaa hyvin joustavasti.)

No ehkä tässä tapauksessa (sen kannalta mitä ajattelin kun tämän
kysymyksen asetin) tuo sana kelpaa. Ja muutkin samanlaiset, joita
joku on käyttänyt.

Mutta nyt pitää täsmentää, että olemassaolo tulkitaan (= minä tässä
yhteydessä tätä tarkoitusta varten tulkitsen) jotensakin konkreettisesti,
eli sana on olemassa vasta kun joku sitä käyttää.

(Vaikka suomen kielen sanoja voi yhdistellä äärettömästi, niin ihmisiä ja
aikaa on vain rajoitetusti, joten sanojen määrä pysyy äärellisenä.)

> Lisäksi pitäisi tietysti määritellä, mikä on "sana". Ovatko
> esimerkiksi taivutusmuodot eri sanoja?

No minusta tässä tapauksessa (hmm...) eivät.

>> Jos arvioin, että 300 000 kertaa 4000 = 1 200 000 000 sanaa,
>> niin mahtaako mennä pahasti metsään?

> Menee.

Hienoa. Tiedämmekö vielä, kumpaan suuntaan?

markus_fin

unread,
Oct 26, 2002, 12:38:58 PM10/26/02
to

"Sampo Smolander" <sampo.smol...@helsinki.fi> kirjoitti viestissä
news:apebkm$69v$2...@oravannahka.helsinki.fi...

> Jukka K. Korpela <jkor...@cs.tut.fi> wrote:

[...]

> >> Jos arvioin, että 300 000 kertaa 4000 = 1 200 000 000 sanaa,
> >> niin mahtaako mennä pahasti metsään?
>
> > Menee.
>
> Hienoa. Tiedämmekö vielä, kumpaan suuntaan?

* * *
Korpela tietää, muttei sano.
Revi siitä huumoria.

m_f

Jukka K. Korpela

unread,
Oct 26, 2002, 10:35:58 AM10/26/02
to
Sampo Smolander <sampo.smol...@helsinki.fi> wrote:

> Montako sanaa mahtaa olla maailmassa olemassa?

Määrittele, mitä tarkoitat olemassaololla. Onko suomen kielessä sana


"höyryturbiiniveli"? (Sitä _on_ käytetty, jutussa, jossa esimerkkinä oli
juuri se, että suomen kielen sanojen määrää ei voida määrittää, koska
yhdyssanoja - ja johdoksiakin - voidaan muodostaa hyvin joustavasti.)

Lisäksi pitäisi tietysti määritellä, mikä on "sana". Ovatko
esimerkiksi taivutusmuodot eri sanoja?

> <http://www.zompist.com/numbers.shtml> kertoo, että maailmassa
> on vähintää 4000 kieltä.

No vähintään.

> Jos arvioin, että 300 000 kertaa 4000 = 1 200 000 000 sanaa,
> niin mahtaako mennä pahasti metsään?

Menee.

--
Yucca, http://www.cs.tut.fi/~jkorpela/indexfi.html
Suomen kielestä: http://www.cs.tut.fi/~jkorpela/suomi/indeksi.html
Kielistä yleensä: http://www.cs.tut.fi/~jkorpela/kielet/

Warp

unread,
Oct 26, 2002, 12:05:35 PM10/26/02
to
Sampo Smolander <sampo.smol...@helsinki.fi> wrote:
> Arvio: <http://www.oed.com/public/inside/funfacts.htm> kertoo,
> että Oxford English dictionaryssä on noin 300 000 sanaa.
> ("Number of main entries").

Vanha Guinnesin ennätyskirja (silloin kun se vielä oli
tietosanakirjamainen, eikä nykyinen kevytversio) kertoo, että englanti
on kieli, jossa on eniten sanoja maailmassa. Se sisältää noin 400000
sanaa ja noin 300000 teknistä sanaa (eli yhteensä noin 700000).
Toisin sanoen, englannin kielen sanamäärän arvio 300000 on reilusti
alakanttiin. Toisaalta se saattaa olla parempi arvio kun arvioidaan, kuinka
paljon sanoja eri kielissä on keskimäärin.

--
#macro N(D)#if(D>99)cylinder{M()#local D=div(D,104);M().5,2pigment{rgb M()}}
N(D)#end#end#macro M()<mod(D,13)-6mod(div(D,13)8)-3,10>#end blob{
N(11117333955)N(4254934330)N(3900569407)N(7382340)N(3358)N(970)}// - Warp -

Jukka K. Korpela

unread,
Oct 26, 2002, 3:51:31 PM10/26/02
to
Sampo Smolander <sampo.smol...@helsinki.fi> wrote:

> Mutta nyt pitää täsmentää, että olemassaolo tulkitaan (= minä tässä
> yhteydessä tätä tarkoitusta varten tulkitsen) jotensakin
> konkreettisesti, eli sana on olemassa vasta kun joku sitä käyttää.

Siinä(kin) tapauksessa vastausta ei voida saada selville, koska vain
hyvin pieni määrä - ja tuntematon määrä - ihmisten kielenkäytöstä on
kirjattu jotenkin.

>> Lisäksi pitäisi tietysti määritellä, mikä on "sana". Ovatko
>> esimerkiksi taivutusmuodot eri sanoja?
>
> No minusta tässä tapauksessa (hmm...) eivät.

Tuon jälkeenkin olisi paljon täsmettävää. Onko "jälkeenkin" eri sana
kuin "jälkeen"? Onko "jälkeen" eri sana kuin "jälkehen"? Vai onko
"jälkeen" kenties vain sanan "jälki" taivutusmuoto, kuten se puhtaasti
morfologiselta kannalta on?

>>> Jos arvioin, että 300 000 kertaa 4000 = 1 200 000 000 sanaa, niin
>>> mahtaako mennä pahasti metsään?
>
>> Menee.
>
> Hienoa. Tiedämmekö vielä, kumpaan suuntaan?

Alakanttiin. Tuo 300 000 sanaa oli yhden sanakirjan sanaluku. Kielen
todellinen sanamäärä on paljon suurempi kuin laajimmankaan sanakirjan
sisältämä. Kielentutkijoiden keräämissä sananäytteissä tiedetään olevan
paljon enemmän sanoja kuin esimerkiksi Nykysuomen sanakirjassa
(Perussanakirjasta puhumattakaan). Toisaalta on selvää, että niihin
näytteisiinkin on päätynyt vain osa sanoista, joita on käytetty.

(Kielten määrä ei tässä ole olennainen, mutta mainitsemasi lähde kertoo
vain lukusanat noin 4 500 kielellä, kun taas yleisesti esitetty arvio
kielten määrästä on pikemminkin 6 000 - 7 000. Tällöinkin lasketaan
kieleksi usein joukko kielimuotoja, joiden puhujat eivät kovinkaan
hyvin ymmärrä toisiaan ja joiden sanastot voivat erota toisistaan
paljonkin.)

Kielen - ainakin suomen kielen - ilmaisuvalikoimaan kuuluvien sanojen
määrä on ääretön (kuitenkin ehkä vain numeroituvasti ääretön:-)), ja
aktuaalisesti käytettyjen sanojen määrä laskematon, mutta varmasti
suurempi kuin sanakirjojen sanojen määrät.

--
Yucca, http://www.cs.tut.fi/~jkorpela/

Jukka K. Korpela

unread,
Oct 27, 2002, 1:21:06 AM10/27/02
to
Warp <wa...@cs.tut.fi> wrote:

> Vanha Guinnesin ennätyskirja (silloin kun se vielä oli
> tietosanakirjamainen, eikä nykyinen kevytversio) kertoo, että englanti
> on kieli, jossa on eniten sanoja maailmassa.

Olisikohan tuon nimenomaisen "tiedon" poistamisen syynä kuitenkin se,
että jonkinlainen (itse)kritiikki alkoi toimia?

Se, että väittää englantia sanamäärältään rikkaimmaksi kieleksi, kertoo
jotain lähinnä siitä, miten vähän väittäjä tuntee eri kieliä.

Tässä vielä muutama sci.lang-ryhmän thread asian tiimoilta vuosien
varrelta:
http://groups.google.com/groups?th=4971007c61d18cad
http://groups.google.com/groups?th=149094c66242d252
http://groups.google.com/groups?th=502d30e97cfef682

Tulipa muuten vasta nyt mieleeni, että enpä muista keskusteluissa aiemmin
mainitun polysynteettisiä kieliä. Niitähän luonnehditaan - ehkä turhankin
yksinkertaistaen - kieliksi, joissa vartalot ja erilaiset päätteet
liittyvät yhteen niin, että jopa koko lause on yhtä sanaa. Esim.
<http://www.sil.org/linguistics/GlossaryOfLinguisticTerms/
WhatIsAPolysyntheticLanguage.htm>
mainitsee esimerkkinä eskimokielen sanan
tuntussuqatarniksaitengqiggtuq
ja selittää sen merkityksen näin: 'He had not yet said again that he was
going to hunt reindeer'. Sanojen määrä polysynteettisessä kielessä on
siis kielen (vähänkin) erilaisten lauseiden määrä. :-)

Tapio Peltonen

unread,
Oct 27, 2002, 6:23:13 AM10/27/02
to
In article <Xns92B3E6FA5DF7...@193.229.0.31>,
Jukka K. Korpela wrote:

> Kielen - ainakin suomen kielen - ilmaisuvalikoimaan kuuluvien sanojen
> määrä on ääretön (kuitenkin ehkä vain numeroituvasti ääretön:-)),

No, ei todellakaan ylinumeroituvasti ääretön, ellei sallita äärettömän
pitkiä sanoja. Luonnollisia lukuja kuvaavia lukusanojakin on jo ääretön
määrä.

--
Tapio Peltonen <tap...@utu.fi>

Anarkian ohella suosikkiasioitani ovat jyrkät ja selvät säännöt sekä käkikellon
tarkkuudella toimiva ruoansulatus. -Anukaisa Alanen, sfnet.huuhaa 3.9.2002

Jukka K. Korpela

unread,
Oct 27, 2002, 8:10:50 AM10/27/02
to
Tapio Peltonen <tap...@utu.fi> wrote:

>> Kielen - ainakin suomen kielen - ilmaisuvalikoimaan kuuluvien sanojen
>> määrä on ääretön (kuitenkin ehkä vain numeroituvasti ääretön:-)),
>
> No, ei todellakaan ylinumeroituvasti ääretön, ellei sallita äärettömän
> pitkiä sanoja. Luonnollisia lukuja kuvaavia lukusanojakin on jo ääretön
> määrä.

Luonnollisestikin numeroituvuusjuttu oli vitsi, kuten hymiöllä yritin
kertoa, mutta sitäkin voi hetkeksi pysähtyä miettimään.

Sanat koostuvat äänteistä, ja äänteet ovat fysikaalisia ilmiöitä, jotka
ovat luonteeltaan jatkuvia. Esimerkiksi täysin soinnillisen konsonantin
ja täysin soinnittoman konsonantin välillä on jatkuva spektri
välimuotoja. Myös vokaalin kesto on luonteeltaan jatkuva, ei diskreetti
suure. (Sivuutan tässä kvanttifysiikan. :-))

Niinpä jopa yhdestä äänteestä koostuvia sanoja voisi olla
ylinumeroituvasti ääretön määrä.

Käytännössä kielten rakenne rajoittaa äänteiden määrän äärelliseksi, jopa
suhteellisen pieneksi. Mutta tämä ajatuskoe osoittaa, että syynä on
ihmiskielten rakenne, ei fysikaalinen todellisuus. Kunkin kielen puhujien
kielitaju esimerkiksi luokittaa äänteet "lyhyiksi" tai "pitkiksi", jos
kielessä tällainen ero ylipäänsä tehdään, tai joissakin kielissä kolmeen
pituusasteeseen. Tällaiset luokitukset tekevät äänteiden (oik. foneemien)
määrästä äärellisen ja siten sanojen joukosta "vain" numeroituvasti
äärettömän.

Warp

unread,
Oct 27, 2002, 3:08:36 PM10/27/02
to
Jukka K. Korpela <jkor...@cs.tut.fi> wrote:
> Sanojen määrä polysynteettisessä kielessä on
> siis kielen (vähänkin) erilaisten lauseiden määrä. :-)

Tämä toki jos määritellään, että "sana" tarkoittaa merkkijonoa, jossa
esiintyy vain kirjaimia.
Kyllähän suomen kielessäkin voi muodostaa lähes rajattomasti tällaisia
"sanoja", kun vain muodostaa kaikki mahdolliset järkevät
yhdyssanakombinaatiot. (Ei liene epäjärkevää, että tällä tavalla voitaisiin
saada ääretön määrä "sanoja".)

Toki käsite "sana" pitää määritellä jotenkin muuten, jotta voidaan
järkevällä tavalla puhua niiden määrästä jossain kielessä.

--
#macro M(A,N,D,L)plane{-z,-9pigment{mandel L*9translate N color_map{[0rgb x]
[1rgb 9]}scale<D,D*3D>*1e3}rotate y*A*8}#end M(-3<1.206434.28623>70,7)M(
-1<.7438.1795>1,20)M(1<.77595.13699>30,20)M(3<.75923.07145>80,99)// - Warp -

markus_fin

unread,
Oct 27, 2002, 4:53:09 PM10/27/02
to

"Tapio Peltonen" <tap...@utu.fi> kirjoitti viestissä
news:slrnarnj51...@grotes.ki.utu.fi...

> In article <Xns92B3E6FA5DF7...@193.229.0.31>,
> Jukka K. Korpela wrote:
>
> > Kielen - ainakin suomen kielen - ilmaisuvalikoimaan kuuluvien
sanojen
> > määrä on ääretön (kuitenkin ehkä vain numeroituvasti ääretön:-)),
>
> No, ei todellakaan ylinumeroituvasti ääretön, ellei sallita äärettömän
> pitkiä sanoja. Luonnollisia lukuja kuvaavia lukusanojakin on jo
ääretön
> määrä.

* * *
Eikö silloin äärettömän suurta luonnollista lukua kuvaava lukusana ole
äärettömän pitkä? Jolloin sanojen määrä olisi ylinumeroituvasti ääretön,
koska on siis sallittava äärettömän pitkä sana?

m_f

Tapio Peltonen

unread,
Oct 27, 2002, 5:14:40 PM10/27/02
to
In article <DcZu9.890$X6.2...@reader1.news.jippii.net>, markus_fin wrote:

>> pitkiä sanoja. Luonnollisia lukuja kuvaavia lukusanojakin on jo
>> ääretön määrä.
>

> Eikö silloin äärettömän suurta luonnollista lukua kuvaava lukusana ole
> äärettömän pitkä? Jolloin sanojen määrä olisi ylinumeroituvasti ääretön,
> koska on siis sallittava äärettömän pitkä sana?

Ääretön ei ole luonnollinen luku. Kaikki luonnolliset luvut ovat
äärellisen mittaisia, vaikka niiden pituudella ei olekaan ylärajaa.

markus_fin

unread,
Oct 28, 2002, 11:33:04 AM10/28/02
to

"Ville Eloranta" <ville.e...@pp1.inet.fi> kirjoitti viestissä
news:sH4v9.13$107....@read2.inet.fi...
> "markus_fin" <marku...@hotmail.com> wrote in message
> news:DcZu9.890$X6.2...@reader1.news.jippii.net...

> > Eikö silloin äärettömän suurta luonnollista lukua kuvaava lukusana
ole
> > äärettömän pitkä? Jolloin sanojen määrä olisi ylinumeroituvasti
> ääretön,
> > koska on siis sallittava äärettömän pitkä sana?
>
> Mennäänkö taas pilkun nussimiseen? Mennään vain, sitähän täällä on
> tapana jatkuvasti harrastaa. Lukusanat eivät ole aina yhtenäisiä vaan
> niissä on sanaliittojakin:
>
> 384 = kolmesataakahdeksankymmentäneljä
> 10 000 = kymmenen tuhatta
> 124 564 = satakaksikymmentäneljä tuhatta viisisataakuusikymmentäneljä
>
> Ja niin poispäin. I rest my case - because I just don't care.

* * *
Ylläoleva response on malliesimerkki siitä, että nyysseissä tapahtuva
viestintä on "tavanomaista" viestintää herkempää väärinymmärryksille,
jostain syystä, josta varmaan on paljon kirjoitettu. Eli tarkoitukseni
ei ollut vittuilla eikä pilkun nussinta. Vaan kommenttini oli ääneen
pohdiskelua, teknisen koulutuksen saaneena ja matematiikan historian ja
populaarimatematiikkakirjallisuuden lukijana.

m_f

Henri Tapani Heinonen

unread,
Oct 28, 2002, 11:43:43 AM10/28/02
to
"Sampo Smolander" <sampo.smol...@helsinki.fi> kirjoitti viestissä
news:ape8o2$3p5$4...@oravannahka.helsinki.fi...

> Montako sanaa mahtaa olla maailmassa olemassa?
> Siis kaikkien kielten kaikka sanat yhteensä.

Kaikkien sanojen laskeminen on käytännössä mahdotonta. Mitä "sana" itse
asiassa tarkoittaa? Missä kulkee sanan ja ei-sanan raja? Pitäisikö
yhdyssanatkin laskea mukaan? Entäs erilaiset taivutusmuodot? Entäs murteiden
sanat? Entäs eri kielten samannäköiset sanat? Entäs homonyymit? Esimerkiksi
"voi" tarkoittaa suomen kielessä ainakin kolmea asiaa: interjektiota, verbiä
ja substantiivia.

--
Verbien taivutuskaava (http://koti.mbnet.fi/henrihe/tiede/verbikaava.html),
päivitetty 16.10.2002.


Pertti Ström

unread,
Oct 28, 2002, 10:47:45 AM10/28/02
to
On 26 Oct 2002 14:27:14 GMT, Sampo Smolander
<sampo.smol...@helsinki.fi> wrote:

>Montako sanaa mahtaa olla maailmassa olemassa?

Tasan 2 938 320 395,6.

--
Paranoideillakin voi olla vihollisia.

Mika Laari

unread,
Oct 28, 2002, 11:07:19 AM10/28/02
to
Tapio Peltonen wrote:
> Luonnollisia lukuja kuvaavia lukusanojakin on jo ääretön
> määrä.

Ei niitä minusta niin paljon ole. Tarkoititko että lukusanoja on
ääretön määrä, koska lukujakin on äärettömästi?

Erittäin isoja lukuja ei sanota yhdellä sanalla, vaan
useasanaisella ilmauksella. Esimerkiksi luvulle kymmenen
potenssiin viisi miljoonaa ei tietääkseni ole omaa sanaa.

Lisäksi on hieman kyseenalaista onko vaikkapa niinkin pieni luku
kuin "viisikymmentäkaksimiljoonaa
kuusisataakahdeksankymmentäyksituhatta neljäkymmentäkaksi" yksi,
kaksi, kolme vai vielä useampi sana.
--
Mika

Pertti Ström

unread,
Oct 28, 2002, 3:02:09 PM10/28/02
to
On Mon, 28 Oct 2002 21:40:43 +0200, "markus_fin"
<marku...@hotmail.com> wrote:

>Siitä huolimatta olisi hauska kuulla ammattimatemaatikon formulointi
>asiasta. Jotenkin tuntuu että sinä et ole.

Kai Sampo jotakin asiasta ymmärtää.
http://www.rni.helsinki.fi/~shs/

Sampo Smolander

unread,
Oct 28, 2002, 12:17:41 PM10/28/02
to
markus_fin <marku...@hotmail.com> wrote:
> "Ville Eloranta" <ville.e...@pp1.inet.fi> kirjoitti viestissä
> news:sH4v9.13$107....@read2.inet.fi...
>> "markus_fin" <marku...@hotmail.com> wrote in message
>> news:DcZu9.890$X6.2...@reader1.news.jippii.net...
>> > Eikö silloin äärettömän suurta luonnollista lukua kuvaava lukusana
>> > ole äärettömän pitkä?

>> 124 564 = satakaksikymmentäneljä tuhatta viisisataakuusikymmentäneljä


>> Ja niin poispäin. I rest my case - because I just don't care.

> Ylläoleva response on malliesimerkki siitä, että nyysseissä tapahtuva


> viestintä on "tavanomaista" viestintää herkempää väärinymmärryksille,
> jostain syystä, josta varmaan on paljon kirjoitettu. Eli tarkoitukseni
> ei ollut vittuilla eikä pilkun nussinta. Vaan kommenttini oli ääneen
> pohdiskelua, teknisen koulutuksen saaneena ja matematiikan historian ja
> populaarimatematiikkakirjallisuuden lukijana.

Ville ilmeisesti oletti että sinä haluat näsäviisastella, ja antoi
samalla mitalla. Oikeasti kysymys ei ilmeisesti ollut näsäilystä
vaan siitä että käsityksesi luonnollisista luvuista on aivan väärä.

Ei sellaista olekaan kuin äärettömän suuri luonnollinen luku.
Mikä tahansa luonnollinen luku on äärellisen kokoinen.

--
Sampo Smolander

Panu Mäkinen

unread,
Oct 28, 2002, 2:34:15 PM10/28/02
to
Warp <wa...@cs.tut.fi> wrote:

> Kyllähän suomen kielessäkin voi muodostaa lähes rajattomasti tällaisia
> "sanoja", kun vain muodostaa kaikki mahdolliset järkevät
> yhdyssanakombinaatiot. (Ei liene epäjärkevää, että tällä tavalla voitaisiin
> saada ääretön määrä "sanoja".)

Jos ajatellaan, että "sana" tarkoittaa suomen kielen aakkostoon
kuuluvista kirjaimista muodostettua merkkijonoa, jolla on jokin
järkevä merkitys suomen kielessä, ei sanojen määrä voi olla ääretön.
On nimittäin olemassa jokin kohtuullisen pieni kokonaisluku,
esim. 685349, jota pidempiä sanoja ei ole olemassa. Kun lisäksi
kirjainten määrä on rajallinen, ei sanojenkaan määrä voi olla
ääretön, vaikka laskisit mukaan kaikki mahdolliset taivutusmuodot
ja yhdyssanat.

-pm


--
_/ _/ _/_/_/ _/ _/
_/_/_/ _/_/_/ _/_/
_/ _/ ortus _/_/_/ otanicus _/ _/ oivulaėnsis
.... http://www.cc.jyu.fi/~pamakine/koivula/ ....

Sampo Smolander

unread,
Oct 28, 2002, 6:56:35 PM10/28/02
to
Pertti Ström <pertt...@hotmail.com> wrote:
>>Siitä huolimatta olisi hauska kuulla ammattimatemaatikon formulointi
>>asiasta. Jotenkin tuntuu että sinä et ole.

> Kai Sampo jotakin asiasta ymmärtää.
> http://www.rni.helsinki.fi/~shs/

No, olen töissä lafkassa jota kai pidetään jonkinlaisena matematiikan
tutkimuslaitoksena, mutta mun oma työ on niin soveltavaa että harva
sitä enää matematiikkana pitäisi.

Sinänsä kysymys siitä, missä sovellettu matematiikka lakkaa
ja sovellusala alkaa, on ihan hyvä! Katsoisin kuitenkin itse
olevani (tällä hetkellä) sovellusalan puolella.

Mutta matematiikan luonteeseen ei oikein kuulu päteä
auktoriteetilla vaan yleensä toivotaan että ihmiset
ajattelisivat asiat läpi ihan itse.

--
Smolander at Helsinki Fi......http://www.rni.helsinki.fi/~shs/

Jukka K. Korpela

unread,
Oct 28, 2002, 4:57:56 PM10/28/02
to
Panu Mäkinen <pama...@jyu.fi.remove.th.is> wrote:

> On nimittäin olemassa jokin kohtuullisen pieni kokonaisluku,
> esim. 685349, jota pidempiä sanoja ei ole olemassa.

Onkohan?

Yksinkertainen.
Kaksinkertainen.
Kolminkertainen.
...

Sanajono ei toki ole pituudeltaan monotonisesti kasvava, mutta jatkamalla
sitä tarpeeksi pitkälle voidaan muodostaa sana, jonka merkkien määrä on
suurempi kuin annettu luku, esim. 685 349.

Mikä on se logiikka, jonka mukaan jonon sanat jossakin vaiheessa
lakkaavat olemasta olemassa?

George Saraiste Jr.

unread,
Oct 29, 2002, 1:10:26 AM10/29/02
to
Warp kirjoitti :
>
>...englanti... ...sisältää noin 400000 sanaa...

Spring = Kevät


...ja noin 300000 teknistä sanaa...

Spring = Jousi


>...(eli yhteensä noin 700000).

Aha?

-- G.S. --

markus_fin

unread,
Oct 29, 2002, 3:11:50 PM10/29/02
to

"Pertti Ström" <pertt...@hotmail.com> kirjoitti viestissä
news:ft5rruku56iutitln...@4ax.com...

> On Mon, 28 Oct 2002 21:40:43 +0200, "markus_fin"
> <marku...@hotmail.com> wrote:
>
> >Siitä huolimatta olisi hauska kuulla ammattimatemaatikon formulointi
> >asiasta. Jotenkin tuntuu että sinä et ole.
>
> Kai Sampo jotakin asiasta ymmärtää.
> http://www.rni.helsinki.fi/~shs/

* * *
Totta, luulisi. Yllätyin.

m_f

Mr. Hirsivaja

unread,
Oct 28, 2002, 4:36:26 AM10/28/02
to
"Sampo Smolander" <sampo.smol...@helsinki.fi> kirjoitti
viestissä:ape8o2$3p5$4...@oravannahka.helsinki.fi...

> Montako sanaa mahtaa olla maailmassa olemassa?

Ääretön.
Mietipä vaikka montako eri lukua merkitsevää sanaa löytyy suomenkielestä.
Yksi, kahdeksankymmentäyksi, viisimiljoonaakaksi...
--

Toni
koti.mbnet.fi/hirsvaja
"Itkevä nainen on vain
märkä väärästä päästä."

Warp

unread,
Oct 31, 2002, 10:53:58 AM10/31/02
to
Mr. Hirsivaja <hirs...@mbnet.fiÖÖÖÖÖ.invalid> wrote:
> Ääretön.
> Mietipä vaikka montako eri lukua merkitsevää sanaa löytyy suomenkielestä.
> Yksi, kahdeksankymmentäyksi, viisimiljoonaakaksi...

Et kai tosissasi väitä, että joka ikiselle luonnolliselle luvulle on
olemassa yksisanainen nimi?

Nimeäpä kokeeksi vaikkapa 10^100000.

Panu Mäkinen

unread,
Oct 31, 2002, 1:26:33 PM10/31/02
to
Jukka K. Korpela <jkor...@cs.tut.fi> wrote:

>> On nimittäin olemassa jokin kohtuullisen pieni kokonaisluku,
>> esim. 685349, jota pidempiä sanoja ei ole olemassa.

> Onkohan?

> Yksinkertainen.
> Kaksinkertainen.
> Kolminkertainen.
> ...

Kuinka pitkälle kuvittelet voivasi jatkaa tuota sanaluetteloa?
Esim. lukua 10^192 pienemmistä luvuista on "auki" kirjoitettuna
pisin Summa(8*10^(k-1)), k=1, 2, 3, ..., 192 (=n), ja siinäkin on
korkeintaan (n/6)(a + b) + c = (192/6)(87 + 21) + 9 = 3467 kirjainta,
missä
n = tarkasteltavassa luvussa olevien numeroinen määrä (= 192)
a = kirjainten määrä sanassa, joka saadaan, kun 888888 kirjoitetaan
kirjaimin (= 87)
b = pisimmän -iljoona-loppuisen sanan pituus (= 21) tarkastelemallani
lukualueella; kyseinen sana lienee kvattuorvigintiljoona
c = kirjainten määrä sanassa kertainen (= 9)

Laskuvirheet ovat mahdollisia, mutta lopputulos lienee kohtuullisen
lähellä oikeaa...

> Sanajono ei toki ole pituudeltaan monotonisesti kasvava, mutta jatkamalla
> sitä tarpeeksi pitkälle voidaan muodostaa sana, jonka merkkien määrä on
> suurempi kuin annettu luku, esim. 685 349.

Mainitsepa yksi näistä sanoista. Minä pääsin vasta korkeintaan
3467-kirjaimiseen sanaa, vaikka käytin lunttilappuna Henri Heinosen
lukuluetteloa sivulta
http://koti.mbnet.fi/henrihe/tiede/suuretluvut.html . Esim. luvulle
10^192 ei mainita mitään -iljoona-loppuista nimeä, on tyydyttävä
lausumaan se potenssiestyksen avulla.

> Mikä on se logiikka, jonka mukaan jonon sanat jossakin vaiheessa
> lakkaavat olemasta olemassa?

Ainakin siinä vaiheessa, jos jokin viritelmä on niin pitkä, ettei
ihmisikä riitä sen lausumiseen. Jos sinusta tuntuu, että antamani
yläraja (685349) suomen kielen sanojen pituuksille on liian pieni,
voit luonnollisesti lisätä siihen jonkin äärellisen luvun, esim. 21,
ilman, että sitä lyhyempien sanojen määrä kasvaisi äärettömyyksiin.

Jukka K. Korpela

unread,
Oct 31, 2002, 2:29:42 PM10/31/02
to
Panu Mäkinen <pama...@jyu.fi.remove.th.is> wrote:

>>> On nimittäin olemassa jokin kohtuullisen pieni kokonaisluku, esim.
>>> 685349, jota pidempiä sanoja ei ole olemassa.
>
>> Onkohan?
>
>> Yksinkertainen.
>> Kaksinkertainen.
>> Kolminkertainen.
>> ...
>
> Kuinka pitkälle kuvittelet voivasi jatkaa tuota sanaluetteloa?

Mehän voisimme vaikkapa istua samaan pöytään ja katsoa, kumpi väsyy
ensin, minä sanojana vai sinä kuulijana. Sinun täytyisi kuitenkin
tarjota jotain kouriintuntuvaa, jotta ryhtyisin haluamaasi kokeeseen.

>> Sanajono ei toki ole pituudeltaan monotonisesti kasvava, mutta
>> jatkamalla sitä tarpeeksi pitkälle voidaan muodostaa sana, jonka
>> merkkien määrä on suurempi kuin annettu luku, esim. 685 349.
>
> Mainitsepa yksi näistä sanoista.

Jaksaisitko ihan oikeasti kuunnella? Tai lukea?

> Esim. luvulle
> 10^192 ei mainita mitään -iljoona-loppuista nimeä, on tyydyttävä
> lausumaan se potenssiestyksen avulla.

Mitä turhia. 10^12 on miljoona miljoonaa (ja vastaava -kertainen-johdos
on yksi sana miljoonamiljoonaakertainen), jne.

Et pysty rakentamaan kielen ilmaisujen pituudelle päteviä apriorisia
periaatteellisia rajoja. Mitä tulee käytännöllisiin rajoihin, veikkaan,
että sinä kuulijana väsyisit ennen kuin minä lausujana.

Esa T Aaltonen

unread,
Nov 1, 2002, 3:47:59 AM11/1/02
to
Jukka K. Korpela <jkor...@cs.tut.fi> wrote:
> Panu Mäkinen <pama...@jyu.fi.remove.th.is> wrote:

> Et pysty rakentamaan kielen ilmaisujen pituudelle päteviä apriorisia
> periaatteellisia rajoja. Mitä tulee käytännöllisiin rajoihin, veikkaan,
> että sinä kuulijana väsyisit ennen kuin minä lausujana.

Siinä kylläkin rikottaisiin kielen varsinaisen tarkoituksen rajoja:
Prototyyppisesti kielellinen prosessi tarvitsee viestin lähettäjän,
viestinvälitysjärjestelmän sekä viestin vastaanottajan. Jos viestin
lähettäjä tuottaa sellaisen kielenilmauksen, jota vastaanottaja ei
kykene vastaanottamaan siksi, ettei ymmärrä tai jaksa psykofyysisistä
syistä kuunnella, viestintäprosessi ei ole molemmille osanottajille
yhteinen. Jos siis ilmaus X määritellään suomen kielen sanaksi,
ilmauksen X pitäisi olla (kenen tahansa) suomenkielisen henkilön
tuotettavissa ja (kenen tahansa) toisen suomenkielisen henkilön
vastaanotettavissa. Mikäli X sattuisi olemaan sellainen ilmaus, jonka
kykenee tuottamaan esim. vain yksi miljoonasta kielenkäyttäjästä ja
vastaanottamaan yksi miljoonasta, kyse olisi minusta pikemmin
erityiskielimuodosta kuin sellaisesta yleiseen ihmistenväliseen
kommunikointiin tarkoitetusta kielijärjestelmästä, jollaista
tarkoitetaan esim. käsitteellä "suomen kieli".

Ilmauksen kelvollisuutta sanaksi voi kokeilla morfofonologisin keinoin:
prototyyppinen suomenkielinen sana on kiinteästi yhteen kuuluva
äännejoukko, jolla on tietty prosodinen rakenne. Jos jonkin teoreettisen
sanaehdokkaan lausuminen kestäisi useita minuutteja, lausujan olisi
fysiologisten pakottavien syiden vuoksi pakko jossakin kohdassa keskeyttää sanan
lausuminen vetääkseen lisää ilmaa keuhkoihin. Kuinka sana-käsitteen
fonologinen luonne prosodisena yksikkönä kestäisi sen, että "sana" olisi
lausuttava useissa osissa? Entäpä jos lausuminen kestäisi esim. viikon?
Esson baarissa kuulemani tieteellisen tutkielman mukaan ihminen kykenee
pysymään hereillä korkeintaan kaksi vuorokautta yhteen menoon. Kuinka
sanan määritelmä kestäisi sen, että sanan lausujan olisi nukuttava
kesken sanan lausumisen ja osattava herätessään jatkaa siitä mihin jäi?

Jos jokin sana todella olisi äärettömän pitkä, sen lausuminen kestäisi
useita sukupolvia, ja tällöin ilmauksen loppuun saattaminen edellyttäisi
jonkinlaista kollektiivista tajuntaa esi-isien ja jälkeläisten välillä
niin, että kymmenen sukupolven jälkeenkin taukoamatonta monotonista
pulputtamista jatkava jälkeläinen tietäisi, mitä sanaa muinainen esi-isä
alkoi joskus lausua.

Todella äärettömän pitkä sana törmää myös yhteen kielihistorian
periaatteiden kanssa: jos oletetaan, että kielen muuttuminen on jatkuvaa
ja väistämätöntä, joudutaan tilanteeseen, jossa kielimuoto muuttuu
toiseksi kesken sanan! Viisituhatta vuotta sitten aloitettu
sananlausunta jatkuisi parhaassakin tapauksessa jollakin etäiseksi
muuntuneella sukukielellä, jolloin kyse ei varmasti olisi enää esim.
"suomenkielisestä" sanasta.

Tämän tolkuttoman spekulointini tarkoituksena on havainnollistaa, että
äärettömän pitkä sana on jo oikeastaan aika hämmentävän pitkä.

EA

Esa T Aaltonen

unread,
Nov 1, 2002, 3:55:47 AM11/1/02
to
Panu Mäkinen <pama...@jyu.fi.remove.th.is> wrote:

> Jos ajatellaan, että "sana" tarkoittaa suomen kielen aakkostoon
> kuuluvista kirjaimista muodostettua merkkijonoa, jolla on jokin
> järkevä merkitys suomen kielessä, ei sanojen määrä voi olla ääretön.

Mutta teoreettinen eri sanojen joukko ei välttämättä edellytä, että
niiden ilmaisemiseen tarvittaisiin yhtä suuri joukko erilaisia
merkkijonoja, sillä homonymia mahdollistaa usean eri sanan ilmaisemisen
samanlaisilla merkkijonoilla. Esim. lukusana "kuusi" ja puuta
tarkoittava "kuusi" ovat ilman muuta eri sanoja, vaikka ne ilmaisemiseen
tarvittavat merkkijonot eivät eroa toisistaan. Vastaavia esimerkkejä on
lukuisia muitakin, vaikka niiden merkitys juuri suomen kielen sanojen
teoreettisen lukumäärän spekuloimisessa ei olekaan suuruusluokkaa
muuttava.

EA

0 new messages