utils/scoring/wer_per_utt_details.pl --special-symbol "***" > $dir/analysis/per_utt_details.txt
--
Go to http://kaldi-asr.org/forums.html find out how to join
---
You received this message because you are subscribed to the Google Groups "kaldi-help" group.
To unsubscribe from this group and stop receiving emails from it, send an email to kaldi-help+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.
To unsubscribe from this group and stop receiving emails from it, send an email to kaldi-help+...@googlegroups.com.
To unsubscribe from this group and stop receiving emails from it, send an email to kaldi-help+unsubscribe@googlegroups.com.
ubuntu@ip-10-0-0-13:raw/train_20h$ grep --color='auto' -P -n "[\x80-\xFF]" text
1387:AT_2013590_0435 ik ben nog maar een uur bezig en volgens het chema mag ik pas over één vijf uur pauze nemen
2680:AT_2021125_0199 volgens mij is ze nieuw en zit ze in één c maar ik weet het niet zeker
2698:AT_2021125_0217 uit één c maar ik weet het niet zeker dat kan niet
...
ubuntu@ip-10-0-0-13:~/data/raw/train_20h$ tail -n +1387 text | head -n1 | hexdump -C -s90
0000005a 65 72 20 c3 a9 c3 a9 6e 20 76 69 6a 66 20 75 75 |er ....n vijf uu|
0000006a 72 20 70 61 75 7a 65 20 6e 65 6d 65 6e 0a |r pauze nemen.|
ubuntu@ip-10-0-0-6:~/data/train_20h_cleaned$ grep --color='auto' -P -n "[\x80-\xFF]" text
2155:AT_2021125_0199-1 <unk> en zit ze in één c maar ik weet het
2167:AT_2021125_0217-1 uit één c maar ik weet het <unk>
7341:AT_2035089_0763-1 ook al gebeurt het maar één keer
ubuntu@ip-10-0-0-6:~/brugklas/data/brugklas_train_20h_cleaned$ tail -n +2155 text | head -n1 | hexdump -C -s40
00000028 7a 65 20 69 6e 20 c3 83 c2 a9 c3 83 c2 a9 6e 20 |ze in ........n |
00000038 63 20 6d 61 61 72 20 69 6b 20 77 65 65 74 20 68 |c maar ik weet h|
00000048 65 74 0a |et.|