Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Frequenza vocali & consonanti dell'Italiano

448 views
Skip to first unread message

Ginzo

unread,
Nov 10, 1998, 3:00:00 AM11/10/98
to
"Stefano Crimě" wrote:

> Ho scritto un programmino che conta le lettere (unificando maiuscole e
> minuscole) e ne riporta le percentuali sul totale.

Bravissimo! Sono quelli come te che rendono utili i newsgroups.

> Dandogli in pasto l'edizione della Divina Commedia in mio possesso (si
> tratta di quella del progetto Manuzio) ha fornito i seguenti risultati:

Permettimi di rimetterli in ordine di frequenza discendente:

1 E : 46670 (11.70%)
2 A : 42483 (10.65%)
3 I : 40340 (10.11%)
4 O : 37839 (9.49%)
5 N : 26602 (6.67%)
6 R : 25984 (6.51%)
7 L : 23423 (5.87%)
8 T : 22889 (5.74%)
9 S : 22654 (5.68%)
10 C : 20851 (5.23%)
11 D : 15086 (3.78%)
12 U : 13612 (3.41%)
13 M : 12118 (3.04%)
14 P : 11412 (2.86%)
15 V : 8224 (2.06%)
16 G : 7347 (1.84%)
17 H : 7116 (1.78%)
18 F : 5332 (1.34%)
19 Q : 3390 (0.85%)
20 B : 3310 (0.83%)
21 Z : 1850 (0.46%)
22 J : 154 (0.04%)
23 X : 143 (0.04%)
24 W : 38 (0.01%)
25 K : 13 (0.00%)
26 Y : 1 (0.00%)

> Per fare una analisi ancora migliore si potrebbe dargli in pasto un
> file contenente qualche migliaio di messaggi dei newsgroup, ma non
> credo che le differenze sarebbero notevoli...

Lo dici tu: ad esempio, Dante non usava la lettera W di neWsgroup con la
frequenza attuale! Ma, a proposito, in quali versi di Dante avresti mai
trovato la W, a cui assegni ben 38 occorrenze?

Bye,

-= Ginzo =-

Kinopa

unread,
Nov 10, 1998, 3:00:00 AM11/10/98
to

Ginzo ha scritto nel messaggio <3647B6B8...@mclink.it>...

>"Stefano Crimì" wrote:
>
>> Ho scritto un programmino che conta le lettere (unificando maiuscole e
>> minuscole) e ne riporta le percentuali sul totale.
>
>Permettimi di rimetterli in ordine di frequenza discendente:
>
>Lo dici tu: ad esempio, Dante non usava la lettera W di neWsgroup con la
>frequenza attuale! Ma, a proposito, in quali versi di Dante avresti mai
>trovato la W, a cui assegni ben 38 occorrenze?


In effetti, la frequenza dei caratteri nella Commedia è la seguente
(distinguendo maiuscole e minuscole, le vocali accentate e quelle non
accentate; non vi appare, ovviamente la W):
A 379
B 223
C 552
D 408
E 588
F 180
G 199
H 2
I 360
L 411
M 405
N 256
O 356
P 473
Q 328
R 117
S 443
T 283
U 43
V 222
Z 7
a 42040
b 2759
c 20268
d 14599
e 46173
f 4947
g 7120
h 7109
i 39642
j 2
l 23094
m 11681
n 26232
o 37260
p 10790
q 3025
r 25806
s 22184
t 22478
u 13467
v 7944
x 3
y 1
z 1849
é 908
à 854
è 919
ì 1387
ò 937
ù 1077
ó 29

Saluti.
Kinopa

Riccardo Campana

unread,
Nov 10, 1998, 3:00:00 AM11/10/98
to
Kinopa <fme...@tin.it> wrote:

> y 1

E questo sicuramente viene dal secondo canto del purgatorio..."in exitu
israel de aegypto"...

Ciao

--
Riccardo Campana
r_ca...@yahoo.com
"There's someone in my head, but it's not me"
==============================================

conpaolo

unread,
Nov 10, 1998, 3:00:00 AM11/10/98
to

Ginzo ha scritto nel messaggio <3647B6B8...@mclink.it>...
>Lo dici tu: ad esempio, Dante non usava la lettera W di neWsgroup con la
>frequenza attuale! Ma, a proposito, in quali versi di Dante avresti mai
>trovato la W, a cui assegni ben 38 occorrenze?


Effettivamente cercando con Trova di Word non risulta niente nella Divina
Commedia (anch'io ho usato quella del progetto Manuzio).

conp...@tin.it

Terrygi

unread,
Nov 10, 1998, 3:00:00 AM11/10/98
to

Kinopa ha scritto nel messaggio <728l9q$slq$1...@nslave1.tin.it>...

>
>Ginzo ha scritto nel messaggio <3647B6B8...@mclink.it>...
>>"Stefano Crimě" wrote:
>Saluti.
>Kinopa


Scusate la mia intromissione , non pertinente tra l'altro , ma io sto
leggendo un libro in cui ho trovato un termine (uno degli infiniti!!) a me
sconosciuto : vi cito la frase in modo che riusciate a darmi migliori
delucidazioni e vi ringrazio in blocco gia' anticipatamente :-))

"In -Le catene di Eymerich- l'autore mette in campo una vicenda attuale ,
dove compaiono figure storiche , e l'indagine che Eymerich ESPERISCE nel
Trecento contro una nuova setta di eretici, tra cui vivono creature mezzo
uomini e mezzo bestie."

Non riesco a capire da dove esca ESPERISCE !!! Perche' non e' stato scritto
piu' semplicemente "esegue e porta a termine" ??

Grazie a tutti e "Con ossequi ciao!".
>--
TerrygiŽ
The Jocker
ter...@cheerful.com

Non e' morto cio' che in eterno puo' attendere,
E con il passare di strane ere anche la morte muore.
H.P. Lovecraft

Ferdinando Chiodo

unread,
Nov 13, 1998, 3:00:00 AM11/13/98
to
On Tue, 10 Nov 1998 20:33:18 +0100, "Terrygi" <pl...@disney.com>
wrote:

> l'indagine che Eymerich ESPERISCE nel
>Trecento contro una nuova setta di eretici,
>

>Non riesco a capire da dove esca ESPERISCE !!! Perche' non e' stato scritto
>piu' semplicemente "esegue e porta a termine" ??

"Esperire" vuol dire mettere alla prova, tentare, sperimentare ed
"esce" dal latino "experiri" che aveva lo stesso significato.
Ciao
Ferdinando Chiodo
--------------------------------------------------------------
mailto: fch...@macronet.it (remove "NOSPAM" from the address)

Stefano Crimì

unread,
Nov 14, 1998, 3:00:00 AM11/14/98
to
On Tue, 10 Nov 1998 04:45:20 +0100, Ginzo <gi...@mclink.it> wrote:

>Lo dici tu: ad esempio, Dante non usava la lettera W di neWsgroup con la
>frequenza attuale! Ma, a proposito, in quali versi di Dante avresti mai
>trovato la W, a cui assegni ben 38 occorrenze?

Lettere accentate nel testo: venivano male interpretate dal programma.
Ciao,
__
(__
__)tefano.

Terrygi

unread,
Nov 14, 1998, 3:00:00 AM11/14/98
to

Ferdinando Chiodo ha scritto nel messaggio
<364c6b1e...@news.flashnet.it>

>"Esperire" vuol dire mettere alla prova, tentare, sperimentare ed
>"esce" dal latino "experiri" che aveva lo stesso significato.
>Ciao
>Ferdinando Chiodo


Grazie infinite per la tua gentilezza !!
In effetti , il protagonista , non avendo mai fatto l'inquisitore , "metteva
alla prova" il suo metodo di inquisire (l'ho capito grazie alla tua
spiegazione !!) , per vedere se funzionava oppure no (tragicamente per i
"poveri" inquisiti , il metodo da lui escogitato , era ottimale ;-))

Saluti ed a presto (se ti piace la SF , comprati il libro "L'ombra di
Eymerich"
edito dalla Mondadori ; il protagonista sembra il rasoio di Occam !!!)

>--
Terrygi®

Nobody

unread,
Nov 18, 1998, 3:00:00 AM11/18/98
to
Ginzo ha scritto nel messaggio <3647B6B8...@mclink.it>...

>> Ho scritto un programmino che conta le lettere (unificando maiuscole e


>> minuscole) e ne riporta le percentuali sul totale.

>Bravissimo! Sono quelli come te che rendono utili i newsgroups.


Beh, veramente programmi che fanno questo tipo di operazioni, in maniera
piu' scientifica, e che sono specifici per l'analisi dei testi, esistono già
da diverso tempo. Ce n'e' uno che è freeware, si chiama VERBUM, è rimasto
alla versione 1.0, e gira sotto DOS, ma per chi si avvicina alla linguistica
computazionale è già abbastanza.
Poi ci sono i programmi che costano già un bel po' di quattrini...

>Permettimi di rimetterli in ordine di frequenze decrescenti:
> 1 E : 46670 (11.70%)

Io credo che si tratti di dati leggermente sballati, probabilmente ottenuti
usando l'edizione distribuita da "liber liber" che non è esattamente esente
da errori.
I miei risultati (condotti sull'edizione Pedrocchi) sono un po' diversi,
comunque eccoli qui di seguito (come potete vedere, la "w" non appare nel
testo della Divina Commedia). Fornisco anche la lunghezza delle parole e le
occorrenze delle punteggiature.

Dante Alighieri - Divina Commedia
N. Parole : 101662

Singoli Caratteri - Dante Alighieri - Divina Commedia
32 91498
33 ! 234
34 " 265
39 ' 7549
40 ( 3
41 ) 3
44 , 8476
45 - 19
46 . 3270
47 / 14233
58 : 1021
59 ; 1622
63 ? 282
65 A 379
66 B 223
67 C 552
68 D 408
69 E 588
70 F 180
71 G 199
72 H 2
73 I 360
76 L 411
77 M 405
78 N 256
79 O 356
80 P 473
81 Q 328
82 R 117
83 S 443
84 T 283
85 U 43
86 V 222
90 Z 7
97 a 42040
98 b 2759
99 c 20268
100 d 14599
101 e 46173
102 f 4947
103 g 7120
104 h 7109
105 i 39642
106 j 2
108 l 23094
109 m 11681
110 n 26232
111 o 37260
112 p 10790
113 q 3025
114 r 25806
115 s 22184
116 t 22478
117 u 13467
118 v 7944
120 x 3
121 y 1
122 z 1849


Punteggiature - Dante Alighieri - Divina Commedia
1 , 8476
2 . 3270
3 ; 1622
4 : 1021
5 - 19
11 ) 3
12 ( 3
18 " 265
19 ? 282
20 ! 234

---------------------

Lunghezza Parole - Dante Alighieri - Divina Commedia
1 7506
2 24390
3 18817
4 10669
5 15500
6 10340
7 6540
8 4220
9 1959
10 1038
11 427
12 180
13 62
14 9
15 5
---------------------

>Lo dici tu: ad esempio, Dante non usava la lettera W di neWsgroup con la
>frequenza attuale! Ma, a proposito, in quali versi di Dante avresti mai
>trovato la W, a cui assegni ben 38 occorrenze?


Non ce ne sono.

V.

0 new messages