Grazie
Non conosco siti specifici, ma lo standard A4 prevede 60 battute per
rigo e trenta righe per pagina,per un totale di 1800 battute, conta le
parole di una pagina ed avrai una idea della media, ma non parlare
di precisione.
ciaofelix:-)
--
questo articolo e` stato inviato via web dal servizio gratuito
http://www.newsland.it/news segnala gli abusi ad ab...@newsland.it
> Non conosco siti specifici, ma lo standard A4
Scrivo per una piccola testata, per cui
ho parecchi documenti, più o meno lunghi, redatti
in quel formato.
Ho provato a calcolare una media, sulla base
di una decina di cartelle, ed il risultato che ho
ottenuto è pari a 7.1 caratteri/parola.
dc
--------------------------------
Inviato via http://arianna.libero.it/usenet/
> Il 27 Mag 2007, 15:32, fdisc...@bbip.it (felix.) ha scritto:
> > Non conosco siti specifici, ma lo standard A4
> Scrivo per una piccola testata, per cui
> ho parecchi documenti, più o meno lunghi, redatti
> in quel formato.
> Ho provato a calcolare una media, sulla base
> di una decina di cartelle, ed il risultato che ho
> ottenuto è pari a 7.1 caratteri/parola.
Tombola! Io dopo aver letto il post ho pensato fra 6 e 7 lettere x
parola.
cia'!
> Tombola! Io dopo aver letto il post ho pensato fra 6 e 7 lettere x
>parola.
Anch'io avevo pensato 7 lettere... Mia bravura, o l'avevo letto chissà
dove, chissà quando?
pgg
Mi sembrava un'esagerazione e ho voluto fare una prova anch'io.
Tesi di laurea:
179 pagine
18925 parole
105362 caratteri (spazi non contati)
I calcoli li ha fatti Word 2007
105362 / 18925 = 5.57 lunghezza media della parola
Bruno
Divina Commedia 4.16
I Promessi Sposi 4.93
Bruno
> Divina Commedia 4.16
> I Promessi Sposi 4.93
Mattina (G.Ungaretti): 4.25
> Bruno
Roger
--
FAQ di ICLIt:
http://www.mauriziopistone.it/testi/linguaitaliana.html
La gola e 'l sonno e l'oziose piume
hanno del mondo ogni vertů sbandita,
ond'č dal corso suo quasi smarrita
nostra natura vinta dal costume.
(F.Petrarca)
> > Divina Commedia 4.16
> > I Promessi Sposi 4.93
> Mattina (G.Ungaretti): 4.25
sono risultati distorti: dalla statistica andrebbero tolte le parole che
si ripetono; le congiunzioni e gli articoli ad esempio, sono d'uso
frequente ed abbassano drasticamente la media.
Se vuoi calcolare la lunghezza media delle parole italiane
che si usano normalmente tutto va incluso: le congiunzioni,
gli articoli, etc, comprendendovi le ripetizioni (frequenze),
altrimenti che media sarebbe?
Se vuoi calcolare la lunghezza media delle parole presenti
in un dizionario allora il procedimento è sicuramente diverso
perché esclude le ripetizioni.
Io credo che la media corretta sia intorno a 5:
la Divina Commedia l'abbassa per il gran numero
di elisioni, analogamente forse (non conosco l'opera)
per la Mattina di Ungaretti.
Bruno
> Se vuoi calcolare la lunghezza media delle parole presenti
> in un dizionario allora il procedimento è sicuramente diverso
Personalmente avevo inteso la domanda in tal senso.
> analogamente forse (non conosco l'opera)
> per la Mattina di Ungaretti.
http://www.francescodebenedetto.it/poesia/ungaretti.htm
Se mi dicevi la cazzata di Ungaretti capivo subito.
Ciao
Bruno
>> per la Mattina di Ungaretti.
>
>http://www.francescodebenedetto.it/poesia/ungaretti.htm
Due parole da otto e due da uno, media 18/4=4.5
Contando "M'" come "mi" e "d'" come "di", 20/4=5
--
"amarrado al recuerdo yo sigo esperando" (Enrique Cadícamo)
***immagini dal mio mondo
http://picasaweb.google.com/rebmin9
http://www.esnips.com/user/jamesleopard/
> "Roger" ha scritto:
>
>>> per la Mattina di Ungaretti.
>>
>>http://www.francescodebenedetto.it/poesia/ungaretti.htm
>
> Due parole da otto e due da uno, media 18/4=4.5
Quali sarebbero le due parole da otto?
> di elisioni
Le elisione vengono considerate una parola unica?
Il 28/5/07 19:00, nell'articolo
465b189c$0$4789$4faf...@reader4.news.tin.it, "Bruno Campanini"
<B...@gmail.com> ha scritto:
>
> Se mi dicevi la cazzata di Ungaretti capivo subito.
hai letto La Prima Volta del Gatto?
--
ma non Avete capito, voi scazzotatori fasciocomusnisti, che preti froci
puttane e politici non fanno più notizia, specialmente per i non giovani che
vogliono salvarsi e se Berlusconi invece di pensare solo ad arricchirsi
avesse fatto la politica della ricerca scientifica seria, oggi saremmo più
avanti nella lotta contro la morte, quindi che andassero pure a morì
ammazzati: froci, puttane, preti e politici che fanno perdere tempo, perchè
noi ci dobbiamo salvare contro la morte e vafammocc a chill'e mmuort per chi
la pensa diversamente!
W ITechnodemocratic
M'illumino
d'immenso
1-8-1-8
>> Quali sarebbero le due parole da otto?
>
> M'illumino
> d'immenso
>
> 1-8-1-8
Prego?
Roger
--
FAQ di ICLIt:
http://www.mauriziopistone.it/testi/linguaitaliana.html
La gola e ’l sonno e l’oziose piume
hanno del mondo ogni vertù sbandita,
ond’è dal corso suo quasi smarrita
>Quali sarebbero le due parole da otto?
illumino, immensso.
> "Roger" ha scritto:
>
>>Quali sarebbero le due parole da otto?
>
> illumino, immensso.
Ma imensso si scrive con una emme sola quindi sono sette
Ciao,
Roger
>Ma imensso si scrive con una emme sola quindi sono sette
Ho sbagliatto: imenssso, ottto
> "Roger" ha scritto:
>
>>Ma imensso si scrive con una emme sola quindi sono sette
>
> Ho sbagliatto: imenssso, ottto
Casssso!
È verro!
Incredibbbile! Che il primo abbia sbagliato, passi: ma io avevo anche
controllato...
>"pgg" wrote
>> Anch'io avevo pensato 7 lettere... Mia bravura, o l'avevo letto chissà
>> dove, chissà quando?
>Mi sembrava un'esagerazione e ho voluto fare una prova anch'io.
>Tesi di laurea:
>179 pagine
>18925 parole
>105362 caratteri (spazi non contati)
>I calcoli li ha fatti Word 2007
>
>105362 / 18925 = 5.57 lunghezza media della parola
Non per contestare il tuo calcolo, ma immagino che dipenda in modo
apprezzabile anche dal contesto: se si tratta, tanto per fare un esempio, di
una tesi di Filosofia, difficilmente occorreranno termini come
"desossidoribonucleico" (DNA) o "diclorodifeniltricloroetano" (DDT)...
;-)
pgg
Parliamo di chi le conta (Word).
Non lo so, bisognerebbe verificare con qualche esempio
ma non ho proprio voglia di farlo.
In ogni caso ritengo che l'apostrofo eventuale (perché anche di
troncamenti dovrebbe parlarsi) non concorra alla conta dei
caratteri... o sě?
Bruno
Si tratta di una tesi di storia, quindi parole comunissime, quelle
che usiamo tutti i giorni.
Bruno
>qualcuno conosce con precisione la lunghezza media delle parole della
>lingua italiana (espressa in lettere) o ha idea di dove posso trovare
>questa informazione?
Le parole italiane sono piane, ossia accento sulla penultima.
L'accento non può essere tanto lontano dall'inizio della frase, ossia
non puoi (almeno agevolmente) pronunciare una parola con l'accento
troppo "lontano" dalla sillaba più lontana.
Diciamo che in media è lontano due sillabe, ossia è alla terza:
CO-NO-SCE'N-ZA
4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
sillabe.
Facendo una media (non pesata, naturalmente), considerando che ogni
sillaba è di lettere, ma ogni tanto ce n'è una di 3 o di 4, facciamo 3
sillabe di due lettere e 1 sillaba di 3.
2x3+3 = 2x4 (proprietà associativa) = 12.
Le parole italiane sono prevalentemente di 12 lettere.
Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
di tale distribuzione, per vedere quanto attendibile è questo dato.
Seguii un corso (Elementi di teoria dell'informazione e della
comunicazione - in pratica tutto Shannon (*)) nel quale (anche) si
analizzavano proprio le distribuzioni delle lettere in diversi testi di
diverse lingue e diversi argomenti.
A che ti serve?
ciao
(*) http://en.wikipedia.org/wiki/Claude_Elwood_Shannon
(*) http://en.wikipedia.org/wiki/A_Mathematical_Theory_of_Communication
--
>Joeva:nnee Neema:n
> Diciamo che in media è lontano due sillabe, ossia è alla terza:
> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
> sillabe.
Permittimi di dirti che in quanto a logica il tuo ragionamento lascia
alquanto a desiderare: su quali fonti si baserebbero la premessa e la
deduzione sopra riportate?
> la maggiorparte delle parole italiane è di 4 sillabe.
> .......
> Le parole italiane sono prevalentemente di 12 lettere.
> .......
> Seguii un corso (Elementi di teoria dell'informazione e della
> comunicazione .......
Pur non avendo seguito nessun corso del genere
(una volta seguii una corsa, ma ciò è alquanto fuori tema...)
posso comunque affermare che il risultato delle tue elucubrazioni
è sicuramente sbagliato.
edi'®
>> Diciamo che in media è lontano due sillabe, ossia è alla terza:
>> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
>> sillabe.
>Permittimi di dirti che in quanto a logica il tuo ragionamento lascia
>alquanto a desiderare: su quali fonti si baserebbero la premessa e la
>deduzione sopra riportate?
La logica è quella del mio ragionamento, è visibile.
La premessa è un dato statistico, esperenziale. Non ha nulla a che
vedere con la logica.
La premessa vera era questa: "Le parole italiane sono piane, ossia
accento sulla penultima."
Il resto sono ragionamenti.
Tale premessa (che forse ho scritto male) significa "LA MAGGIORPARTE
delle parole italiane...". Mi devo proprio essere espresso male.
La cosa è risaputa.
>Pur non avendo seguito nessun corso del genere
>(una volta seguii una corsa, ma ciò è alquanto fuori tema...)
>posso comunque affermare che il risultato delle tue elucubrazioni
>è sicuramente sbagliato.
Può darsi.
Perché?
Tu cosa proponi in alternativa?
Anche se le mie conclusioni fossero erronee, che ne pensi del metodo?
ciao
> Anche se le mie conclusioni fossero erronee, che ne pensi del metodo?
Tu affermi che "Le parole italiane sono prevalentemente di 12 lettere"
perché, evidentemente, hai molta fiducia in questo metodo. Ma come
fai a non accorgerti che le conclusioni sono così palesemente errate?
Sarà colpa del metodo, sarà colpa delle premesse... sta di fatto che
non c'è bisogno di conoscere alcuna teoria della comunicazione per
notare che ciò non è vero.
Prendiamo il tuo messaggio delle 11.45, a cui ho risposto pocanzi:
ci sono quasi duecento parole, di cui tre (!) da dodici lettere:
- bisognerebbe
- informazione
- analizzavano
edi'®
> Le parole italiane sono piane, ossia accento sulla penultima.
>
> L'accento non può essere tanto lontano dall'inizio della frase,
Cosa significa che "l'accento non può essere tanto lontano dall'inizio della
frase"
> ossia
> non puoi (almeno agevolmente) pronunciare una parola con l'accento
> troppo "lontano" dalla sillaba più lontana.
> Diciamo che in media è lontano due sillabe, ossia è alla terza:
Lo dici tu, a capocchia.
Parole bisillabe come "casa", "cane", "pane", "letto", "culo" sono
frequentissime.
> CO-NO-SCE'N-ZA
>
> 4 sillabe. Significa che la maggiorparte delle parole italiane è di 4
> sillabe.
Fesseria.
Conta, nel tuo post, quante quadrisillabe hai scritto.
La stragrande maggioranza delle parole italiane sono bi- e trisillabe
> Facendo una media (non pesata, naturalmente), considerando che ogni
> sillaba è di lettere, ma ogni tanto ce n'è una di 3 o di 4, facciamo 3
> sillabe di due lettere e 1 sillaba di 3.
>
> 2x3+3 = 2x4 (proprietà associativa) = 12.
LOL
> Le parole italiane sono prevalentemente di 12 lettere.
Sei lontano anniluce dalla realtà
La lunghezza media delle parole italiane, imho, è di 4-5 lettere
> Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
> di tale distribuzione, per vedere quanto attendibile è questo dato.
E vediamolo questo scarto quadratico medio! :-)
Ciao,
> 2x3+3 = 2x4 (proprietà associativa) = 12.
Tralasciamo per un attimo le teorie dell'informazione e della
comunicazione e guardiamo un attimo anche l'aritmetica:
che razzo di calcolo sarebbe quello qui sopra?
edi'®
>Prendiamo il tuo messaggio delle 11.45, a cui ho risposto pocanzi:
>ci sono quasi duecento parole, di cui tre (!) da dodici lettere:
>- bisognerebbe
>- informazione
>- analizzavano
č vero. non conto gli articoli, le preposizioni, le congiunzioni, le
voci verbali...
che disdetta.
peccato.
> La logica è quella del mio ragionamento, è visibile.
già, vedo vedo...
> è un dato statistico, esperenziale.
ah, ora mi è chiaro!
> La cosa è risaputa.
beh, ora sono tranquillo.
>> Le parole italiane sono piane, ossia accento sulla penultima.
>> L'accento non può essere tanto lontano dall'inizio della frase,
>Cosa significa che "l'accento non può essere tanto lontano dall'inizio della
>frase"
parola, scusa.
>Lo dici tu, a capocchia.
>Parole bisillabe come "casa", "cane", "pane", "letto", "culo" sono
>frequentissime.
vabbè, non ciò penzato.
>Sei lontano anniluce dalla realtà
>La lunghezza media delle parole italiane, imho, è di 4-5 lettere
3 7 8 4 6 2 8 5 4 6 8 4 1 2 7 -> 5
pò esse
>> Nauralmente da qui bisognerebbe vedere qual è lo scarto quadratico medio
>> di tale distribuzione, per vedere quanto attendibile è questo dato.
>E vediamolo questo scarto quadratico medio! :-)
evidentemente mi sbaglio.
il modo migliore sarebbe un piccolo programmino in C che analizzi un
file TXT datogli in pasto. Magari un libro scaricato da Liber Liber.
Però non mi va di farlo...
"aò pure Bruno pò sbajà" (cit)
>> 2x3+3 = 2x4 (proprietà associativa) = 12.
> e guardiamo un attimo anche l'aritmetica:
>che razzo di calcolo sarebbe quello qui sopra?
sto popo a tocchi.
avevo fatto 2x3+3= 2x (3+1)...invece è 3x(+1).
la proprietà associativa però c'era...
vabbè, scusate la mia partecipazione ridicola a questo thread :-(
[...]
> vabbč, scusate la mia partecipazione ridicola a questo thread :-(
Non era il giorno buono, evidentemente. Capita!
Comunque hai trovato anche qualche malignetto di troppo.
Circa il programma in C per esaminare un testo, non ce l'hai
Word? Quello ti conta pagine, righe, parole, caratteri, spazi.
E di testi in Liber Liber ne trovi a iosa.
Ciao
Bruno
>Circa il programma in C per esaminare un testo, non ce l'hai
>Word? Quello ti conta pagine, righe, parole, caratteri, spazi.
>E di testi in Liber Liber ne trovi a iosa.
a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
benedetta risposta, così la facciamo finita! :-))
parlavo di C perché a suo tempo feci così.
> a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
> benedetta risposta, così la facciamo finita! :-))
I dati che ho passato per la DC e I Promessi Sposi li ho
desunti - come dichiarato - da Word...
Vuoi che te li rilevi per qualche opera letteraria in particolare?
Bruno
>> a vabbè, allora se già si può fare che qualcuno lo faccia e dia una
>> benedetta risposta, così la facciamo finita! :-))
>I dati che ho passato per la DC e I Promessi Sposi li ho
>desunti - come dichiarato - da Word...
>Vuoi che te li rilevi per qualche opera letteraria in particolare?
DC?
non ho capito niente.
hai già detto ciò in un altro post?
io non seguo tutto questo thread, purtroppo. Solo questo sub-thread.
ciao
> Parliamo di chi le conta (Word).
> Non lo so, bisognerebbe verificare con qualche esempio
Ho verificato: "qual'è" conta sette caratteri,
quindi l'apostrofo, come ti hai infatti affermato,
per Word è un carattere.
Verificare con qualche esempio, ma dove?
dc
--------------------------------
Inviato via http://arianna.libero.it/usenet/
>[...]
Veramente interessante la tua teoria.
Ma credo che la varianza sulla media
da te calcolata sia molto alta; è complicato verificare
e trovare i campioni adatti.
Inoltre non sempre le parole italiane, almeno credo,
hanno l'accento sulla penultima sillaba né si può affermare
che ogni sillaba abbia una lunghezza predefinita; è evidente
come una media di 3 caratteri per sillaba con casi di 4 e casi di 2
creino, anche in questo contesto, uno sqm altissimo.
La tua media, credo, sia molto poco affidabile.
Ribadisco però, molto interessante.
> è vero. non conto gli articoli, le preposizioni, le congiunzioni, le
> voci verbali...
Ehm.... andrebbero contate.
> il modo migliore sarebbe un piccolo programmino in C che analizzi un
> file TXT datogli in pasto. Magari un libro scaricato da Liber Liber.
O una buona calcolatriche e Word.
E' facile, si controllano n° parole ed
n° caratteri totali. Si dividono i caratteri per le parole
sottraendo prima (n° parole-1) spazi.
Per il resto dovrei avere in giro qualcosa in Excel
o addirittura in VB, di qualche tempo fa, per calcolare
m ed Var, ma è facile anche con una calcolatrice.
Basta, andiamo OT :)
>Ho verificato: "qual'č" conta sette caratteri,
>quindi l'apostrofo, come ti hai infatti affermato,
>per Word č un carattere.
Non lo considera un errore?
> DC?
Divina Commedia.
Qualche post indietro ha indicato la lunghezza
media delle parole nella Divina Commedia e ne
"I pomessi sposi": mi pare venisse attorno al 5,
relativamente molto bassa dunque.
> Divina Commedia.
> Qualche post indietro ha indicato la lunghezza
> media delle parole nella Divina Commedia e ne
> "I pomessi sposi": mi pare venisse attorno al 5,
> relativamente molto bassa dunque.
Forse perché ogni tanto, per distrazione, si perde per strada qualche
lettera...
> dc
Turna?
Ciao,
Epimeteo
---
"Caro amico, ti scrivo
così mi distraggo un po'..."
(cit. distratta)
> "Caro amico, ti scrivo
> così mi distraggo un po'..."
> (cit. distratta)
" Caro papà,
ti scrivo e la mia mano
quasi mi trema - lo comprendi tu?
e questa l'ho trovata in Internet.
Ma c'era anche "ti scrivo la presente
col grado militare di tenente";
di questa non ho trovato traccia.
Io le ho cantate in divisa da
Figlio della Lupa (non quella di Verga...)
Bruno
>> č vero. non conto gli articoli, le preposizioni, le congiunzioni, le
>> voci verbali...
>Ehm.... andrebbero contate.
e vabbč...
>Ma credo che la varianza sulla media
>da te calcolata sia molto alta; è complicato verificare
>e trovare i campioni adatti.
lo credo anche io.
>Inoltre non sempre le parole italiane, almeno credo,
>hanno l'accento sulla penultima sillaba né si può affermare
>che ogni sillaba abbia una lunghezza predefinita; è evidente
>come una media di 3 caratteri per sillaba con casi di 4 e casi di 2
>creino, anche in questo contesto, uno sqm altissimo.
sì, questi dati di fatto erano errati.
>La tua media, credo, sia molto poco affidabile.
me ne sono poi accorto.
>Ribadisco però, molto interessante.
grazie
ciao
> Il 28 Mag 2007, 23:25, "Bruno Campanini" <B...@gmail.com> ha scritto:
>
>> Parliamo di chi le conta (Word).
>> Non lo so, bisognerebbe verificare con qualche esempio
>
> Ho verificato: "qual'è" conta sette caratteri,
Ho verificato anche io, ma con "l'amor".
> quindi l'apostrofo, come ti hai infatti affermato,
> per Word è un carattere.
Al di la' dell'essere un carattere (anche lo spazio lo e'), la prova
dimostra senz'altro che Word considera "l'amor" una parola singola.
Tuttavia Word e' il miglior strumento per questo tipo di prove?
Ciao,
Myszka