Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

lunghezza parole italiane

146 views
Skip to first unread message

mai...@gmail.com

unread,
May 27, 2007, 6:55:19 AM5/27/07
to
Ciao a tutti,
qualcuno conosce con precisione la lunghezza media delle parole della
lingua italiana (espressa in lettere) o ha idea di dove posso trovare
questa informazione?

Grazie

felix.

unread,
May 27, 2007, 9:32:23 AM5/27/07
to
mai...@gmail.com ha scritto:

Non conosco siti specifici, ma lo standard A4 prevede 60 battute per
rigo e trenta righe per pagina,per un totale di 1800 battute, conta le
parole di una pagina ed avrai una idea della media, ma non parlare
di precisione.
ciaofelix:-)


--

questo articolo e` stato inviato via web dal servizio gratuito
http://www.newsland.it/news segnala gli abusi ad ab...@newsland.it


Ildavide {ildavide.altervista.org}

unread,
May 27, 2007, 10:31:20 AM5/27/07
to
Il 27 Mag 2007, 15:32, fdisc...@bbip.it (felix.) ha scritto:

> Non conosco siti specifici, ma lo standard A4

Scrivo per una piccola testata, per cui
ho parecchi documenti, più o meno lunghi, redatti
in quel formato.

Ho provato a calcolare una media, sulla base
di una decina di cartelle, ed il risultato che ho
ottenuto è pari a 7.1 caratteri/parola.

dc

--------------------------------
Inviato via http://arianna.libero.it/usenet/

felix.

unread,
May 27, 2007, 10:46:12 AM5/27/07
to
Ildavide {ildavide.altervista.org} ha scritto:

> Il 27 Mag 2007, 15:32, fdisc...@bbip.it (felix.) ha scritto:

> > Non conosco siti specifici, ma lo standard A4

> Scrivo per una piccola testata, per cui
> ho parecchi documenti, più o meno lunghi, redatti
> in quel formato.

> Ho provato a calcolare una media, sulla base
> di una decina di cartelle, ed il risultato che ho
> ottenuto è pari a 7.1 caratteri/parola.

Tombola! Io dopo aver letto il post ho pensato fra 6 e 7 lettere x
parola.
cia'!

pgg

unread,
May 27, 2007, 12:00:15 PM5/27/07
to
(felix.) ha scritto:

> Tombola! Io dopo aver letto il post ho pensato fra 6 e 7 lettere x
>parola.

Anch'io avevo pensato 7 lettere... Mia bravura, o l'avevo letto chissà
dove, chissà quando?
pgg


Bruno Campanini

unread,
May 28, 2007, 8:50:40 AM5/28/07
to
"pgg" <p...@libero.it> wrote in message
news:eeaj535fppppfrn18...@4ax.com...

Mi sembrava un'esagerazione e ho voluto fare una prova anch'io.
Tesi di laurea:
179 pagine
18925 parole
105362 caratteri (spazi non contati)
I calcoli li ha fatti Word 2007

105362 / 18925 = 5.57 lunghezza media della parola

Bruno

Bruno Campanini

unread,
May 28, 2007, 8:55:10 AM5/28/07
to
"Bruno Campanini" <B...@gmail.com> wrote in message
news:465ad015$0$4786$4faf...@reader4.news.tin.it...

Divina Commedia 4.16
I Promessi Sposi 4.93

Bruno

Roger

unread,
May 28, 2007, 9:02:34 AM5/28/07
to

"Bruno Campanini" ha scritto:

> Divina Commedia 4.16
> I Promessi Sposi 4.93

Mattina (G.Ungaretti): 4.25

> Bruno

Roger
--
FAQ di ICLIt:
http://www.mauriziopistone.it/testi/linguaitaliana.html

La gola e 'l sonno e l'oziose piume
hanno del mondo ogni vertů sbandita,
ond'č dal corso suo quasi smarrita
nostra natura vinta dal costume.
(F.Petrarca)

Woody

unread,
May 28, 2007, 9:13:34 AM5/28/07
to
Roger ha scritto:

> > Divina Commedia 4.16
> > I Promessi Sposi 4.93
> Mattina (G.Ungaretti): 4.25

sono risultati distorti: dalla statistica andrebbero tolte le parole che
si ripetono; le congiunzioni e gli articoli ad esempio, sono d'uso
frequente ed abbassano drasticamente la media.

Bruno Campanini

unread,
May 28, 2007, 9:45:30 AM5/28/07
to
"Woody" <wo...@wood.it> wrote in message
news:f3ekhu$8f1$1...@news.newsland.it...

> Roger ha scritto:
>
>> > Divina Commedia 4.16
>> > I Promessi Sposi 4.93
>> Mattina (G.Ungaretti): 4.25
>
> sono risultati distorti: dalla statistica andrebbero tolte le parole che
> si ripetono; le congiunzioni e gli articoli ad esempio, sono d'uso
> frequente ed abbassano drasticamente la media.

Se vuoi calcolare la lunghezza media delle parole italiane
che si usano normalmente tutto va incluso: le congiunzioni,
gli articoli, etc, comprendendovi le ripetizioni (frequenze),
altrimenti che media sarebbe?

Se vuoi calcolare la lunghezza media delle parole presenti
in un dizionario allora il procedimento è sicuramente diverso
perché esclude le ripetizioni.

Io credo che la media corretta sia intorno a 5:
la Divina Commedia l'abbassa per il gran numero
di elisioni, analogamente forse (non conosco l'opera)
per la Mattina di Ungaretti.

Bruno

Woody

unread,
May 28, 2007, 9:53:27 AM5/28/07
to
Bruno Campanini ha scritto:

> Se vuoi calcolare la lunghezza media delle parole presenti
> in un dizionario allora il procedimento è sicuramente diverso

Personalmente avevo inteso la domanda in tal senso.

Roger

unread,
May 28, 2007, 11:29:04 AM5/28/07
to

"Bruno Campanini" ha scritto:

> analogamente forse (non conosco l'opera)
> per la Mattina di Ungaretti.

http://www.francescodebenedetto.it/poesia/ungaretti.htm

Bruno Campanini

unread,
May 28, 2007, 2:00:16 PM5/28/07
to
"Roger" <rugfa...@tin.it> wrote in message
news:465af53b$0$17952$4faf...@reader1.news.tin.it...

>
> "Bruno Campanini" ha scritto:
>
>> analogamente forse (non conosco l'opera)
>> per la Mattina di Ungaretti.
>
> http://www.francescodebenedetto.it/poesia/ungaretti.htm

Se mi dicevi la cazzata di Ungaretti capivo subito.

Ciao
Bruno

FatherMcKenzie

unread,
May 28, 2007, 2:25:56 PM5/28/07
to
Al Carrefour de l'Arbre "Roger" <rugfa...@tin.it> scatta sul pavé
"cinq-étoiles" viscido per la pioggia, che fa ancor più amaro
l'inferno del Nord. Sferrando furibondi calci ai pedali lo raggiungo.
Si volta e dice:

Due parole da otto e due da uno, media 18/4=4.5
Contando "M'" come "mi" e "d'" come "di", 20/4=5
--
"amarrado al recuerdo yo sigo esperando" (Enrique Cadícamo)
***immagini dal mio mondo
http://picasaweb.google.com/rebmin9
http://www.esnips.com/user/jamesleopard/

Roger

unread,
May 28, 2007, 2:28:27 PM5/28/07
to

"FatherMcKenzie" ha scritto:

> "Roger" ha scritto:


>
>>> per la Mattina di Ungaretti.
>>
>>http://www.francescodebenedetto.it/poesia/ungaretti.htm
>
> Due parole da otto e due da uno, media 18/4=4.5

Quali sarebbero le due parole da otto?

Ildavide {ildavide.altervista.org}

unread,
May 28, 2007, 2:28:28 PM5/28/07
to
Il 28 Mag 2007, 15:45, "Bruno Campanini" <B...@gmail.com> ha scritto:

> di elisioni

Le elisione vengono considerate una parola unica?

riccardomustodario

unread,
May 28, 2007, 2:34:19 PM5/28/07
to


Il 28/5/07 19:00, nell'articolo
465b189c$0$4789$4faf...@reader4.news.tin.it, "Bruno Campanini"
<B...@gmail.com> ha scritto:

>

> Se mi dicevi la cazzata di Ungaretti capivo subito.

hai letto La Prima Volta del Gatto?


--
ma non Avete capito, voi scazzotatori fasciocomusnisti, che preti froci
puttane e politici non fanno più notizia, specialmente per i non giovani che
vogliono salvarsi e se Berlusconi invece di pensare solo ad arricchirsi
avesse fatto la politica della ricerca scientifica seria, oggi saremmo più
avanti nella lotta contro la morte, quindi che andassero pure a morì
ammazzati: froci, puttane, preti e politici che fanno perdere tempo, perchè
noi ci dobbiamo salvare contro la morte e vafammocc a chill'e mmuort per chi
la pensa diversamente!
W ITechnodemocratic


Sergio Michele

unread,
May 28, 2007, 3:19:27 PM5/28/07
to

"Roger" <rugfa...@tin.it> ha scritto nel messaggio
news:465b1f45$0$37194$4faf...@reader3.news.tin.it...

>
> "FatherMcKenzie" ha scritto:
>
>> "Roger" ha scritto:
>>
>>>> per la Mattina di Ungaretti.
>>>
>>>http://www.francescodebenedetto.it/poesia/ungaretti.htm
>>
>> Due parole da otto e due da uno, media 18/4=4.5
>
> Quali sarebbero le due parole da otto?

M'illumino
d'immenso

1-8-1-8


Roger

unread,
May 28, 2007, 3:49:17 PM5/28/07
to

"Sergio Michele" ha scritto:
>
> "Roger" ha scritto:

>> Quali sarebbero le due parole da otto?


>
> M'illumino
> d'immenso
>
> 1-8-1-8

Prego?

La gola e ’l sonno e l’oziose piume

hanno del mondo ogni vertù sbandita,
ond’è dal corso suo quasi smarrita

FatherMcKenzie

unread,
May 28, 2007, 4:00:17 PM5/28/07
to
Al Carrefour de l'Arbre "Roger" <rugfa...@tin.it> scatta sul pavé
"cinq-étoiles" viscido per la pioggia, che fa ancor più amaro
l'inferno del Nord. Sferrando furibondi calci ai pedali lo raggiungo.
Si volta e dice:

>Quali sarebbero le due parole da otto?

illumino, immensso.

Roger

unread,
May 28, 2007, 4:02:57 PM5/28/07
to

"FatherMcKenzie" ha scritto:

> "Roger" ha scritto:
>

>>Quali sarebbero le due parole da otto?
>
> illumino, immensso.

Ma imensso si scrive con una emme sola quindi sono sette

Ciao,
Roger

FatherMcKenzie

unread,
May 28, 2007, 4:05:48 PM5/28/07
to
Al Carrefour de l'Arbre "Roger" <rugfa...@tin.it> scatta sul pavé
"cinq-étoiles" viscido per la pioggia, che fa ancor più amaro
l'inferno del Nord. Sferrando furibondi calci ai pedali lo raggiungo.
Si volta e dice:

>Ma imensso si scrive con una emme sola quindi sono sette

Ho sbagliatto: imenssso, ottto

Roger

unread,
May 28, 2007, 4:07:39 PM5/28/07
to

"FatherMcKenzie" ha scritto:

> "Roger" ha scritto:
>


>>Ma imensso si scrive con una emme sola quindi sono sette
>
> Ho sbagliatto: imenssso, ottto

Casssso!
È verro!

Sergio Michele

unread,
May 28, 2007, 4:26:42 PM5/28/07
to

"Roger" <rugfa...@tin.it> ha scritto nel messaggio
news:465b3237$0$37195$4faf...@reader3.news.tin.it...

>
> "Sergio Michele" ha scritto:
>>
>> "Roger" ha scritto:
>
>>> Quali sarebbero le due parole da otto?
>>
>> M'illumino
>> d'immenso
>>
>> 1-8-1-8
>
> Prego?

Incredibbbile! Che il primo abbia sbagliato, passi: ma io avevo anche
controllato...


pgg

unread,
May 28, 2007, 5:14:37 PM5/28/07
to
"Bruno Campanini" ha scritto:

>"pgg" wrote

>> Anch'io avevo pensato 7 lettere... Mia bravura, o l'avevo letto chissà
>> dove, chissà quando?

>Mi sembrava un'esagerazione e ho voluto fare una prova anch'io.


>Tesi di laurea:
>179 pagine
>18925 parole
>105362 caratteri (spazi non contati)
>I calcoli li ha fatti Word 2007
>
>105362 / 18925 = 5.57 lunghezza media della parola

Non per contestare il tuo calcolo, ma immagino che dipenda in modo
apprezzabile anche dal contesto: se si tratta, tanto per fare un esempio, di
una tesi di Filosofia, difficilmente occorreranno termini come
"desossidoribonucleico" (DNA) o "diclorodifeniltricloroetano" (DDT)...
;-)
pgg

Bruno Campanini

unread,
May 28, 2007, 5:25:20 PM5/28/07
to
"Ildavide {ildavide.altervista.org}" <chi...@me.la> wrote in message
news:80Z104Z2Z240Y1...@usenet.libero.it...

> Il 28 Mag 2007, 15:45, "Bruno Campanini" <B...@gmail.com> ha scritto:
>
>> di elisioni
>
> Le elisione vengono considerate una parola unica?

Parliamo di chi le conta (Word).
Non lo so, bisognerebbe verificare con qualche esempio
ma non ho proprio voglia di farlo.
In ogni caso ritengo che l'apostrofo eventuale (perché anche di
troncamenti dovrebbe parlarsi) non concorra alla conta dei
caratteri... o sě?

Bruno

Bruno Campanini

unread,
May 28, 2007, 5:27:29 PM5/28/07
to
"pgg" <p...@libero.it> wrote in message
news:cugm53digd86020gs...@4ax.com...

Si tratta di una tesi di storia, quindi parole comunissime, quelle
che usiamo tutti i giorni.

Bruno

Giovanni "Darke" Neiman

unread,
May 29, 2007, 5:45:20 AM5/29/07
to
On 27 May 2007 03:55:19 -0700, mai...@gmail.com wrote:

>qualcuno conosce con precisione la lunghezza media delle parole della
>lingua italiana (espressa in lettere) o ha idea di dove posso trovare
>questa informazione?

Le parole italiane sono piane, ossia accento sulla penultima.

L'accento non può essere tanto lontano dall'inizio della frase, ossia
non puoi (almeno agevolmente) pronunciare una parola con l'accento
troppo "lontano" dalla sillaba più lontana.

Diciamo che in media è lontano due sillabe, ossia è alla terza:

CO-NO-SCE'N-ZA

4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
sillabe.


Facendo una media (non pesata, naturalmente), considerando che ogni
sillaba è di lettere, ma ogni tanto ce n'è una di 3 o di 4, facciamo 3
sillabe di due lettere e 1 sillaba di 3.

2x3+3 = 2x4 (proprietà associativa) = 12.


Le parole italiane sono prevalentemente di 12 lettere.


Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
di tale distribuzione, per vedere quanto attendibile è questo dato.


Seguii un corso (Elementi di teoria dell'informazione e della
comunicazione - in pratica tutto Shannon (*)) nel quale (anche) si
analizzavano proprio le distribuzioni delle lettere in diversi testi di
diverse lingue e diversi argomenti.


A che ti serve?


ciao


(*) http://en.wikipedia.org/wiki/Claude_Elwood_Shannon
(*) http://en.wikipedia.org/wiki/A_Mathematical_Theory_of_Communication

--
>Joeva:nnee Neema:n

Woody

unread,
May 29, 2007, 6:10:03 AM5/29/07
to
Giovanni "Darke" Neiman ha scritto:

> Diciamo che in media è lontano due sillabe, ossia è alla terza:

> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
> sillabe.

Permittimi di dirti che in quanto a logica il tuo ragionamento lascia
alquanto a desiderare: su quali fonti si baserebbero la premessa e la
deduzione sopra riportate?

edi'®

unread,
May 29, 2007, 6:33:17 AM5/29/07
to
"Giovanni "Darke" Neiman" <darth...@libero.it> ha scritto

> la maggiorparte delle parole italiane è di 4 sillabe.

> .......


> Le parole italiane sono prevalentemente di 12 lettere.

> .......


> Seguii un corso (Elementi di teoria dell'informazione e della

> comunicazione .......

Pur non avendo seguito nessun corso del genere
(una volta seguii una corsa, ma ciò è alquanto fuori tema...)
posso comunque affermare che il risultato delle tue elucubrazioni
è sicuramente sbagliato.

edi'®

Giovanni "Darke" Neiman

unread,
May 29, 2007, 6:44:37 AM5/29/07
to
On Tue, 29 May 2007 12:10:03 +0200, wo...@wood.it (Woody) wrote:

>> Diciamo che in media è lontano due sillabe, ossia è alla terza:
>> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
>> sillabe.
>Permittimi di dirti che in quanto a logica il tuo ragionamento lascia
>alquanto a desiderare: su quali fonti si baserebbero la premessa e la
>deduzione sopra riportate?

La logica è quella del mio ragionamento, è visibile.

La premessa è un dato statistico, esperenziale. Non ha nulla a che
vedere con la logica.

La premessa vera era questa: "Le parole italiane sono piane, ossia
accento sulla penultima."

Il resto sono ragionamenti.

Tale premessa (che forse ho scritto male) significa "LA MAGGIORPARTE
delle parole italiane...". Mi devo proprio essere espresso male.

La cosa è risaputa.


http://www.google.it/search?hl=it&client=firefox-a&rls=org.mozilla%3Ait%3Aofficial&hs=Qzy&q=%22parole+italiane%22+piane&btnG=Cerca&meta=

Giovanni "Darke" Neiman

unread,
May 29, 2007, 6:45:26 AM5/29/07
to
On Tue, 29 May 2007 12:33:17 +0200, edi'® <zo...@tiscali.it> wrote:


>Pur non avendo seguito nessun corso del genere
>(una volta seguii una corsa, ma ciò è alquanto fuori tema...)
>posso comunque affermare che il risultato delle tue elucubrazioni
>è sicuramente sbagliato.

Può darsi.

Perché?

Tu cosa proponi in alternativa?


Anche se le mie conclusioni fossero erronee, che ne pensi del metodo?

ciao

edi'®

unread,
May 29, 2007, 7:02:32 AM5/29/07
to
"Giovanni "Darke" Neiman" <darth...@libero.it> ha scritto

> Anche se le mie conclusioni fossero erronee, che ne pensi del metodo?


Tu affermi che "Le parole italiane sono prevalentemente di 12 lettere"
perché, evidentemente, hai molta fiducia in questo metodo. Ma come
fai a non accorgerti che le conclusioni sono così palesemente errate?
Sarà colpa del metodo, sarà colpa delle premesse... sta di fatto che
non c'è bisogno di conoscere alcuna teoria della comunicazione per
notare che ciò non è vero.

Prendiamo il tuo messaggio delle 11.45, a cui ho risposto pocanzi:
ci sono quasi duecento parole, di cui tre (!) da dodici lettere:
- bisognerebbe
- informazione
- analizzavano

edi'®

Roger

unread,
May 29, 2007, 7:38:13 AM5/29/07
to

"Giovanni "Darke" Neiman" ha scritto:

> Le parole italiane sono piane, ossia accento sulla penultima.


>
> L'accento non può essere tanto lontano dall'inizio della frase,

Cosa significa che "l'accento non può essere tanto lontano dall'inizio della
frase"

> ossia


> non puoi (almeno agevolmente) pronunciare una parola con l'accento
> troppo "lontano" dalla sillaba più lontana.
> Diciamo che in media è lontano due sillabe, ossia è alla terza:

Lo dici tu, a capocchia.
Parole bisillabe come "casa", "cane", "pane", "letto", "culo" sono
frequentissime.

> CO-NO-SCE'N-ZA
>
> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
> sillabe.

Fesseria.
Conta, nel tuo post, quante quadrisillabe hai scritto.
La stragrande maggioranza delle parole italiane sono bi- e trisillabe

> Facendo una media (non pesata, naturalmente), considerando che ogni
> sillaba è di lettere, ma ogni tanto ce n'è una di 3 o di 4, facciamo 3
> sillabe di due lettere e 1 sillaba di 3.
>
> 2x3+3 = 2x4 (proprietà associativa) = 12.

LOL

> Le parole italiane sono prevalentemente di 12 lettere.

Sei lontano anniluce dalla realtà
La lunghezza media delle parole italiane, imho, è di 4-5 lettere

> Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
> di tale distribuzione, per vedere quanto attendibile è questo dato.

E vediamolo questo scarto quadratico medio! :-)

Ciao,

edi'®

unread,
May 29, 2007, 7:53:23 AM5/29/07
to
"Giovanni "Darke" Neiman" <darth...@libero.it> ha scritto

> 2x3+3 = 2x4 (proprietà associativa) = 12.

Tralasciamo per un attimo le teorie dell'informazione e della
comunicazione e guardiamo un attimo anche l'aritmetica:
che razzo di calcolo sarebbe quello qui sopra?

edi'®

Giovanni "Darke" Neiman

unread,
May 29, 2007, 8:38:34 AM5/29/07
to
On Tue, 29 May 2007 13:02:32 +0200, edi'Ž <zo...@tiscali.it> wrote:

>Prendiamo il tuo messaggio delle 11.45, a cui ho risposto pocanzi:
>ci sono quasi duecento parole, di cui tre (!) da dodici lettere:
>- bisognerebbe
>- informazione
>- analizzavano

č vero. non conto gli articoli, le preposizioni, le congiunzioni, le
voci verbali...

che disdetta.


peccato.

Woody

unread,
May 29, 2007, 8:40:54 AM5/29/07
to
Giovanni "Darke" Neiman ha scritto:

> La logica è quella del mio ragionamento, è visibile.

già, vedo vedo...

> è un dato statistico, esperenziale.

ah, ora mi è chiaro!

> La cosa è risaputa.

beh, ora sono tranquillo.

Giovanni "Darke" Neiman

unread,
May 29, 2007, 8:42:12 AM5/29/07
to
On Tue, 29 May 2007 13:38:13 +0200, "Roger" <rugfa...@tin.it> wrote:

>> Le parole italiane sono piane, ossia accento sulla penultima.
>> L'accento non può essere tanto lontano dall'inizio della frase,
>Cosa significa che "l'accento non può essere tanto lontano dall'inizio della
>frase"

parola, scusa.

>Lo dici tu, a capocchia.
>Parole bisillabe come "casa", "cane", "pane", "letto", "culo" sono
>frequentissime.

vabbè, non ciò penzato.

>Sei lontano anniluce dalla realtà
>La lunghezza media delle parole italiane, imho, è di 4-5 lettere

3 7 8 4 6 2 8 5 4 6 8 4 1 2 7 -> 5

pò esse

>> Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
>> di tale distribuzione, per vedere quanto attendibile è questo dato.
>E vediamolo questo scarto quadratico medio! :-)

evidentemente mi sbaglio.


il modo migliore sarebbe un piccolo programmino in C che analizzi un
file TXT datogli in pasto. Magari un libro scaricato da Liber Liber.

Però non mi va di farlo...


"aò pure Bruno pò sbajà" (cit)

Giovanni "Darke" Neiman

unread,
May 29, 2007, 8:44:35 AM5/29/07
to
On Tue, 29 May 2007 13:53:23 +0200, edi'® <zo...@tiscali.it> wrote:

>> 2x3+3 = 2x4 (proprietà associativa) = 12.

> e guardiamo un attimo anche l'aritmetica:
>che razzo di calcolo sarebbe quello qui sopra?


sto popo a tocchi.


avevo fatto 2x3+3= 2x (3+1)...invece è 3x(+1).

la proprietà associativa però c'era...


vabbè, scusate la mia partecipazione ridicola a questo thread :-(

Bruno Campanini

unread,
May 29, 2007, 8:52:40 AM5/29/07
to
"Giovanni "Darke" Neiman" <darth...@libero.it> wrote in message

[...]
> vabbč, scusate la mia partecipazione ridicola a questo thread :-(

Non era il giorno buono, evidentemente. Capita!
Comunque hai trovato anche qualche malignetto di troppo.

Circa il programma in C per esaminare un testo, non ce l'hai
Word? Quello ti conta pagine, righe, parole, caratteri, spazi.
E di testi in Liber Liber ne trovi a iosa.

Ciao
Bruno

Giovanni "Darke" Neiman

unread,
May 29, 2007, 12:00:36 PM5/29/07
to
On Tue, 29 May 2007 14:52:40 +0200, "Bruno Campanini" <B...@gmail.com>
wrote:

>Circa il programma in C per esaminare un testo, non ce l'hai
>Word? Quello ti conta pagine, righe, parole, caratteri, spazi.
>E di testi in Liber Liber ne trovi a iosa.

a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
benedetta risposta, così la facciamo finita! :-))


parlavo di C perché a suo tempo feci così.

Bruno Campanini

unread,
May 29, 2007, 12:57:50 PM5/29/07
to
"Giovanni "Darke" Neiman" <darth...@libero.it> wrote in message
news:jejo535c4cq2g4rfh...@4ax.com...

> a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
> benedetta risposta, così la facciamo finita! :-))

I dati che ho passato per la DC e I Promessi Sposi li ho
desunti - come dichiarato - da Word...

Vuoi che te li rilevi per qualche opera letteraria in particolare?

Bruno

Giovanni "Darke" Neiman

unread,
May 29, 2007, 3:52:04 PM5/29/07
to
On Tue, 29 May 2007 18:57:50 +0200, "Bruno Campanini" <B...@gmail.com>
wrote:


>> a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
>> benedetta risposta, così la facciamo finita! :-))
>I dati che ho passato per la DC e I Promessi Sposi li ho
>desunti - come dichiarato - da Word...
>Vuoi che te li rilevi per qualche opera letteraria in particolare?

DC?

non ho capito niente.


hai già detto ciò in un altro post?

io non seguo tutto questo thread, purtroppo. Solo questo sub-thread.


ciao

Ildavide {ildavide.altervista.org}

unread,
May 29, 2007, 5:36:49 PM5/29/07
to
Il 28 Mag 2007, 23:25, "Bruno Campanini" <B...@gmail.com> ha scritto:

> Parliamo di chi le conta (Word).
> Non lo so, bisognerebbe verificare con qualche esempio

Ho verificato: "qual'è" conta sette caratteri,
quindi l'apostrofo, come ti hai infatti affermato,
per Word è un carattere.

Verificare con qualche esempio, ma dove?

dc

--------------------------------
Inviato via http://arianna.libero.it/usenet/

Ildavide {ildavide.altervista.org}

unread,
May 29, 2007, 5:43:15 PM5/29/07
to
Il 29 Mag 2007, 11:45, "Giovanni \"Darke\" Neiman" <darth...@libero.it>
ha scritto:

>[...]

Veramente interessante la tua teoria.
Ma credo che la varianza sulla media
da te calcolata sia molto alta; è complicato verificare
e trovare i campioni adatti.

Inoltre non sempre le parole italiane, almeno credo,
hanno l'accento sulla penultima sillaba né si può affermare
che ogni sillaba abbia una lunghezza predefinita; è evidente
come una media di 3 caratteri per sillaba con casi di 4 e casi di 2
creino, anche in questo contesto, uno sqm altissimo.

La tua media, credo, sia molto poco affidabile.

Ribadisco però, molto interessante.

Ildavide {ildavide.altervista.org}

unread,
May 29, 2007, 5:46:38 PM5/29/07
to
Il 29 Mag 2007, 14:38, "Giovanni \"Darke\" Neiman" <darth...@libero.it>
ha scritto:

> è vero. non conto gli articoli, le preposizioni, le congiunzioni, le
> voci verbali...

Ehm.... andrebbero contate.

Ildavide {ildavide.altervista.org}

unread,
May 29, 2007, 5:52:06 PM5/29/07
to
Il 29 Mag 2007, 14:42, "Giovanni \"Darke\" Neiman" <darth...@libero.it>
ha scritto:

> il modo migliore sarebbe un piccolo programmino in C che analizzi un


> file TXT datogli in pasto. Magari un libro scaricato da Liber Liber.

O una buona calcolatriche e Word.
E' facile, si controllano n° parole ed
n° caratteri totali. Si dividono i caratteri per le parole
sottraendo prima (n° parole-1) spazi.

Per il resto dovrei avere in giro qualcosa in Excel
o addirittura in VB, di qualche tempo fa, per calcolare
m ed Var, ma è facile anche con una calcolatrice.

Basta, andiamo OT :)

pgg

unread,
May 29, 2007, 5:54:54 PM5/29/07
to
(Ildavide {ildavide.altervista.org}) ha scritto:

>Ho verificato: "qual'č" conta sette caratteri,


>quindi l'apostrofo, come ti hai infatti affermato,

>per Word č un carattere.

Non lo considera un errore?

Ildavide {ildavide.altervista.org}

unread,
May 29, 2007, 5:55:35 PM5/29/07
to
Il 29 Mag 2007, 21:52, "Giovanni \"Darke\" Neiman" <darth...@libero.it>
ha scritto:

> DC?

Divina Commedia.
Qualche post indietro ha indicato la lunghezza
media delle parole nella Divina Commedia e ne
"I pomessi sposi": mi pare venisse attorno al 5,
relativamente molto bassa dunque.

Epimeteo

unread,
May 30, 2007, 1:39:43 AM5/30/07
to

"Ildavide {ildavide.altervista.org}" <chi...@me.la> ha scritto nel messaggio
news:80Z104Z1Z111Y1...@usenet.libero.it...

> Il 29 Mag 2007, 21:52, "Giovanni \"Darke\" Neiman" <darth...@libero.it>
> ha scritto:
>
>> DC?

> Divina Commedia.
> Qualche post indietro ha indicato la lunghezza
> media delle parole nella Divina Commedia e ne
> "I pomessi sposi": mi pare venisse attorno al 5,
> relativamente molto bassa dunque.

Forse perché ogni tanto, per distrazione, si perde per strada qualche
lettera...

> dc

Turna?

Ciao,
Epimeteo
---
"Caro amico, ti scrivo
così mi distraggo un po'..."
(cit. distratta)

Ildavide {ildavide.altervista.org}

unread,
May 30, 2007, 5:40:46 AM5/30/07
to
Il 30 Mag 2007, 07:39, "Epimeteo" <ep...@tin.it> ha scritto:

> > dc

> Turna?

Davide C.
:)

Bruno Campanini

unread,
May 30, 2007, 5:41:44 AM5/30/07
to
"Epimeteo" <ep...@tin.it> wrote in message
news:465d0e16$0$37204$4faf...@reader3.news.tin.it...

> "Caro amico, ti scrivo
> così mi distraggo un po'..."
> (cit. distratta)

" Caro papà,
ti scrivo e la mia mano
quasi mi trema - lo comprendi tu?

e questa l'ho trovata in Internet.

Ma c'era anche "ti scrivo la presente
col grado militare di tenente";
di questa non ho trovato traccia.

Io le ho cantate in divisa da
Figlio della Lupa (non quella di Verga...)

Bruno

Giovanni "Darke" Neiman

unread,
May 31, 2007, 9:59:06 AM5/31/07
to
On Tue, 29 May 2007 21:46:38 GMT, chi...@me.la (Ildavide
{ildavide.altervista.org}) wrote:

>> č vero. non conto gli articoli, le preposizioni, le congiunzioni, le


>> voci verbali...
>Ehm.... andrebbero contate.

e vabbč...

Giovanni "Darke" Neiman

unread,
May 31, 2007, 10:00:47 AM5/31/07
to
On Tue, 29 May 2007 21:43:15 GMT, chi...@me.la (Ildavide
{ildavide.altervista.org}) wrote:

>Ma credo che la varianza sulla media
>da te calcolata sia molto alta; è complicato verificare
>e trovare i campioni adatti.

lo credo anche io.

>Inoltre non sempre le parole italiane, almeno credo,
>hanno l'accento sulla penultima sillaba né si può affermare
>che ogni sillaba abbia una lunghezza predefinita; è evidente
>come una media di 3 caratteri per sillaba con casi di 4 e casi di 2
>creino, anche in questo contesto, uno sqm altissimo.

sì, questi dati di fatto erano errati.

>La tua media, credo, sia molto poco affidabile.

me ne sono poi accorto.

>Ribadisco però, molto interessante.

grazie


ciao

Myszka

unread,
Jun 1, 2007, 7:09:29 AM6/1/07
to
il giorno 29/05/2007 23.36 Ildavide {ildavide.altervista.org} ha scritto:

> Il 28 Mag 2007, 23:25, "Bruno Campanini" <B...@gmail.com> ha scritto:
>
>> Parliamo di chi le conta (Word).
>> Non lo so, bisognerebbe verificare con qualche esempio
>
> Ho verificato: "qual'è" conta sette caratteri,

Ho verificato anche io, ma con "l'amor".

> quindi l'apostrofo, come ti hai infatti affermato,
> per Word è un carattere.

Al di la' dell'essere un carattere (anche lo spazio lo e'), la prova
dimostra senz'altro che Word considera "l'amor" una parola singola.

Tuttavia Word e' il miglior strumento per questo tipo di prove?

Ciao,
Myszka

0 new messages