Keyword Spotting

784 views
Skip to first unread message

raghav...@gmail.com

unread,
Jan 15, 2016, 2:08:55 AM1/15/16
to kaldi-help
Hi,

I have been trying to use kws-search for a keyword spotting system. I have been provided with the decoded lattices. This is all I have. Hence I will have to start with the given decoded lattices and obtain a kws system. The first step I did was to obtain the index file using lattice-to-kws-index and save that file as index.idx.

Then I obtained the fsts file for the keyword (which is another input to the keyword-search) using transcripts-to-fsts (I have not used any options provided in the program). The input to this was a text file in which I just listed a set of keywords. My first question 1) Is there any specific format in which I have to prepare the text file which contained the keywords or would it be enough that I just list the keywords in the file and then save it as a text file. 2) The program did give me an output file which I had named it as keywords.fsts which contained the keyword in one line and a zero in the next line and it repeated the pattern like

keyword1
0

keyword2
0

keyword3
0
...


what is the 0 here? Is that some kind of a score? Or have I got the process wrong?

Anyway, after obtaining the keywords.fsts file I used the command kws-search


kws-search ark:KALINDX.idx ark:keywords.fsts ark,t:res.r  (KALINDX.idx -index file, keywords.fsts - fsts file that I mentioned and res.r - results file)

and I had the program give out the following error


ERROR (kws-search:Value():util/kaldi-table-inl.h:2025) Value() called but no such key global in archive KALINDX.idx
ERROR (kws-search:Value():util/kaldi-table-inl.h:2025) Value() called but no such key global in archive KALINDX.idx

[stack trace: ]
kaldi::KaldiGetStackTrace()
kaldi::KaldiErrorMessage::~KaldiErrorMessage()
kaldi::RandomAccessTableReaderUnsortedArchiveImpl<fst::VectorFstTplHolder<fst::ArcTpl<fst::LexicographicWeight<fst::TropicalWeightTpl<float>, fst::LexicographicWeight<fst::TropicalWeightTpl<float>, fst::TropicalWeightTpl<float> > > > > >::Value(std::string const&)
kaldi::RandomAccessTableReader<fst::VectorFstTplHolder<fst::ArcTpl<fst::LexicographicWeight<fst::TropicalWeightTpl<float>, fst::LexicographicWeight<fst::TropicalWeightTpl<float>, fst::TropicalWeightTpl<float> > > > > >::Value(std::string const&)
kws-search(main+0x6b7) [0x5f1196]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf5) [0x7f50b9942ec5]
kws-search() [0x5f09e9]


Am I doing anything wrong? Is there any other file that has to be prepared?

Please note that I am just trying it on command line in order to check out the sequence before I do anything more with it. I hope kws-search should search the lattice and give me the list of occurrences or is the program looking out for any other information?

I have also checked the index file which only contained a list of numbers (Actually five columns of numbers out of which I believe the third column is the mapping to the word as i found a similar number in words.txt file provided along with the lattices (Have Pasted a part of the index file obtained below)

Hoping for a reply soon.

Thanking you.

Regards
Raghav


F001_safm_01150102061000_F001_001168_002250 ( Utterance Name)
0    1    18968    0    0,462,770                       ( Mapping from words.txt)
0    2    18979    0    0.0664062,0,66
0    3    25323    0    0,66,81
0    4    0    1    -3.43652,29,1061
0    5    54041    0    0,75,117
0    6    38532    0    0,117,144
0    7    38539    0    31.5801,117,150
0    8    18794    0    2.74023,29,73
0    9    2557    0    0,150,176
0    10    4340    0    0,176,199
0    11    54666    0    0,199,256
0    12    7135    0    0,144,152
0    13    42381    0    0,256,301
0    14    24422    0    5.95508,301,324
0    15    24441    0    0.00292969,301,314
0    16    1880    0    0,314,352
0    17    18300    0    0,352,366
0    18    6964    0    0,366,410
0    19    20155    0    0,410,427
0    20    5    0    0,671,770
0    21    17102    0    5.77637,427,770
0    22    7160    0    0,503,770
0    23    38368    0    0,518,770
0    24    37728    0    0,547,770
0    25    11076    0    0,582,770
0    26    54209    0    0,705,770
0    27    28302    0    0,770,788
0    28    20159    0    0,788,831
0    29    20283    0    80.0527,788,831
0    30    4991    0    0,831,856
0    31    15804    0    19.6719,856,944
0    32    16305    0    150.771,856,944
0    33    16244    0    38.0127,885,944
0    34    16289    0    44.9023,885,944
0    35    16292    0    5.64453,885,944
0    36    16357    0    6.07715,885,944
0    37    16387    0    0.00585938,885,944
0    38    51215    0    0,944,960
0    39    1808    0    0.0185547,960,1003
0    40    2028    0    3.98047,960,1003
0    41    21686    0    1.37695,983,1024
0    42    7620    0    79.6533,983,1035
0    43    10415    0    78.2773,983,1035
0    44    10722    0    62.1934,983,1035
0    45    10759    0    67.2822,983,1024
0    46    20723    0    0.291016,983,1035
0    47    21685    0    15.1328,983,1035
0    48    21768    0    68.3389,983,1035
0    49    21803    0    83.6553,983,1035
0    50    21804    0    83.7412,983,1025
0    51    21810    0    80.9453,983,1025
0    52    22171    0    73.9336,983,1035
0    53    22178    0    76.6455,983,1014
0    54    22486    0    50.2725,983,1035
0    55    22553    0    48.7188,983,1035
0    56    22830    0    45.4385,983,1024
0    57    22932    0    43.8408,983,1035
0    58    22933    0    41.1865,983,1035
0    59    22953    0    26.3848,983,1024
0    60    22955    0    82.04,983,1024
0    61    23429    0    72.0039,983,1017
0    62    23853    0    128.78,983,1041
0    63    24042    0    29.626,983,1024
0    64    24193    0    86.5615,983,1035
0    65    24409    0    28.918,983,1035
0    66    24412    0    29.8369,983,1024
0    67    24458    0    129.188,983,1044
0    68    24552    0    72.5322,983,1035
0    69    24630    0    64.123,983,1035
0    70    24631    0    64.4834,983,1025
0    71    24641    0    63.3086,983,1025
0    72    27693    0    66.4189,983,1024
0    73    28148    0    77.6729,983,1035
0    74    41469    0    92.374,983,1035
0    75    50566    0    0.181641,1014,1082
0    76    50678    0    1.79688,1017,1082
0    77    3605    0    40.8926,1014,1082
0    78    3780    0    31.9717,1024,1082
0    79    4069    0    32.3115,1024,1082
0    80    4363    0    51.752,1014,1082
0    81    4505    0    30.0635,1014,1082
0    82    57053    0    129.188,1044,1082
0    83    3775    0    70.4814,1024,1082
0    84    4631    0    55.8379,1024,1082
0    85    38905    0    31.4619,1024,1082
0    86    39179    0    31.4365,1024,1082
0    87    50565    0    13.7168,1024,1061
0    88    39541    0    123.66,1024,1082
0    89    50716    0    78.1494,1024,1082
0    90    50723    0    86.959,1024,1082
0    91    50933    0    102.499,1024,1082
0    92    23831    0    13.7168,1061,1082
1    8    18794    0    2.74023,-462,-697
1    22    7160    0
1    4    1    1    2.74023,-462,-741
1    4    23    1    0,0,-267
2    93    25323    0    0,0,15
2    4    2    1
3    94    54041    0    0,0,36
3    4    3    1
4
5    95    18968    0    79.6191,352,653
5    96    38532    0    0,0,27
5    7    38539    0    31.5801,0,33
5    33    16244    0    38.0127,781,827
5    34    16289    0    44.9023,781,827
5    97    16292    0    5.64453,781,827
5    36    16357    0    6.07715,781,827
5    37    16387    0    0.00585938,781,827
5    4    5    1
5    4    22    1    79.6191,352,345
5    4    37    1    0,781,768
6    12    7135    0    0,0,8
6    98    5    0    0,541,626
6    4    6    1
6    4    28    1    0,541,527
7    99    2557    0    0,0,26
7    4    7    1
8    100    25323    0    0,0,2
8    4    8    1
9    101    4340    0    0,0,23
9    4    9    1
10    11    54666    0    0,0,57
10    4    10    1
11    13    42381    0    0,0,45
11    4    11    1
12    102    2557    0    0,0,24
12    4    12    1
13    14    24422    0    5.95508,0,23
13    15    24441    0    0.00292969,0,13
13    4    13    1
14    103    1880    0    0,0,28
14    4    14    1
15    104    1880    0    0,0,38
15    4    15    1
16    17    18300    0    0,0,14
16    105    21686    0    14.8711,646,672
16    42    7620    0    79.6533,646,683
16    43    10415    0    78.2773,646,683
16    44    10722    0    62.1934,646,683
16    45    10759    0    67.2822,646,672
16    46    20723    0    14.3047,646,683
16    47    21685    0    28.7109,646,683
16    48    21768    0    68.3389,646,683
16    49    21803    0    83.6553,646,683
16    50    21804    0    83.7412,646,673
16    51    21810    0    80.9453,646,673
16    52    22171    0    73.9336,646,683
16    53    22178    0    76.6455,646,662
16    54    22486    0    50.2725,646,683
16    55    22553    0    48.7188,646,683
16    56    22830    0    45.4385,646,672
16    57    22932    0    43.8408,646,683
16    58    22933    0    41.1865,646,683
16    59    22953    0    26.3848,646,672
16    60    22955    0    82.04,646,672
16    61    23429    0    72.0039,646,665
16    62    23853    0    128.78,646,689
16    63    24042    0    29.626,646,672
16    64    24193    0    86.5615,646,683
16    65    24409    0    28.918,646,683
16    66    24412    0    29.8369,646,672
16    67    24458    0    129.188,646,692
16    68    24552    0    72.5322,646,683
16    69    24630    0    64.123,646,683
16    70    24631    0    64.4834,646,673
16    71    24641    0    63.3086,646,673
16    72    27693    0    66.4189,646,672
16    73    28148    0    77.6729,646,683
16    74    41469    0    92.374,646,683
16    4    16    1
16    4    45    1    13.8555,646,631
17    18    6964    0    0,0,44
17    4    17    1
18    19    20155    0    0,0,17
18    4    18    1
19    106    54041    0    79.6191,0,343
19    107    5    0    0.00292969,0,343
19    21    17102    0    5.77637,0,343
19    4    19    1
20    108    18968    0    0.00292969,-244,0
20    26    54209    0
20    4    20    1    0.00292969,-244,-306
20    4    29    1    0,0,-65
21    109    18968    0
21    4    21    1    0,0,-307
22    23    38368    0
22    4    24    1    0,0,-252
23    24    37728    0
23    4    25    1    0,0,-223
24    25    11076    0
24    4    26    1    0,0,-188
25    110    38532    0
25    4    27    1    0,0,-112
26    27    28302    0    0,0,18
26    4    30    1
27    28    20159    0    0,0,43
27    29    20283    0    80.0527,0,43
27    4    31    1
28    111    4991    0    0,0,25
28    4    32    1
29    112    4991    0    0,0,25
29    4    33    1
30    113    54041    0    0,0,29
30    31    15804    0    19.6719,0,88
30    32    16305    0    150.771,0,88
30    4    34    1
31    114    16292    0
31    4    35    1    0,0,-56
32    38    51215    0    0,0,16
32    4    36    1
33    38    51215    0    0,0,16
33    4    38    1
34    38    51215    0    0,0,16
34    4    39    1
35    38    51215    0    0,0,16
35    4    40    1
36    38    51215    0    0,0,16
36    4    41    1
37    38    51215    0    0,0,16
37    4    42    1
38    115    1880    0    13.8555,0,23
38    39    1808    0    0.0185547,0,43
38    40    2028    0    3.98047,0,43
38    4    43    1
39    116    21686    0    1.43457,0,21
39    46    20723    0    0.271484,0,32
39    47    21685    0    15.1133,0,32
39    4    44    1
40    116    21686    0    0,0,21
40    4    46    1
41    75    50566    0    0.181641,0,58
41    76    50678    0    1.79688,0,58
41    77    3605    0    50.2783,0,58
41    78    3780    0    41.3564,0,58
41    79    4069    0    41.6963,0,58
41    80    4363    0    61.1377,0,58
41    81    4505    0    39.4482,0,58
41    83    3775    0    79.8662,0,58
41    85    38905    0    30.085,0,58
41    86    39179    0    30.0596,0,58
41    87    50565    0    13.7168,0,37
41    88    39541    0    122.283,0,58
41    89    50716    0    78.1494,0,58
41    90    50723    0    85.582,0,58
41    91    50933    0    101.122,0,58
41    4    47    1
42    75    50566    0    0.181641,0,47
42    76    50678    0    1.79688,0,47
42    4    48    1
43    75    50566    0    0,0,47
43    4    49    1
44    75    50566    0    0,0,47
44    4    50    1
45    75    50566    0    0,0,58
45    80    4363    0    59.127,0,58
45    4    51    1
46    75    50566    0    0.181641,0,47
46    76    50678    0    1.79688,0,47
46    87    50565    0    13.7168,0,26
46    89    50716    0    78.1494,0,47
46    4    52    1
47    75    50566    0    0.181641,0,47
47    76    50678    0    1.79688,0,47
47    87    50565    0    13.7168,0,26
47    89    50716    0    78.1494,0,47
47    4    53    1
48    75    50566    0    0,0,47
48    4    54    1
49    75    50566    0    0.181641,0,47
49    76    50678    0    1.79688,0,47
49    4    55    1
50    77    3605    0    10.8203,0,57
50    80    4363    0    21.6895,0,57
50    81    4505    0    0,0,57
50    4    56    1
51    75    50566    0    16.7979,0,57
51    77    3605    0    11.0459,0,57
51    78    3780    0    2.13477,0,57
51    79    4069    0    2.47461,0,57
51    80    4363    0    21.915,0,57
51    81    4505    0    0.226562,0,57
51    83    3775    0    40.6445,0,57
51    4    57    1
52    75    50566    0    0.181641,0,47
52    76    50678    0    1.79688,0,47
52    4    58    1
53    75    50566    0    1.82715,0,68
53    77    3605    0    11.0049,0,68
53    80    4363    0    21.8643,0,68
53    81    4505    0    0.175781,0,68
53    4    59    1
54    75    50566    0    0,0,47
54    4    60    1
55    75    50566    0    0.181641,0,47
55    76    50678    0    1.79688,0,47
55    4    61    1
56    75    50566    0    0.181641,0,58
56    76    50678    0    1.79688,0,58
56    77    3605    0    50.2783,0,58
56    78    3780    0    41.3564,0,58
56    79    4069    0    41.6963,0,58
56    80    4363    0    61.1377,0,58
56    81    4505    0    39.4482,0,58
56    87    50565    0    13.7168,0,37
56    4    62    1
57    75    50566    0    0.181641,0,47
57    76    50678    0    1.79688,0,47
57    87    50565    0    13.7168,0,26
57    4    63    1
58    75    50566    0    0.181641,0,47
58    76    50678    0    1.79688,0,47
58    4    64    1
59    75    50566    0    0.181641,0,58
59    76    50678    0    1.79688,0,58
59    87    50565    0    13.7168,0,37
59    77    3605    0    48.4463,0,58
59    78    3780    0    39.5254,0,58
59    79    4069    0    39.8652,0,58
59    80    4363    0    59.3057,0,58
59    81    4505    0    37.6172,0,58
59    4    65    1
60    75    50566    0    0.181641,0,58
60    76    50678    0    1.79688,0,58
60    80    4363    0    60.748,0,58
60    4    66    1
61    75    50566    0    0.181641,0,65
61    76    50678    0    1.79688,0,65
61    77    3605    0    48.8955,0,65
61    80    4363    0    59.7646,0,65
61    81    4505    0    38.0664,0,65
61    4    67    1
62    80    4363    0    0,0,41
62    4    68    1
63    75    50566    0    0.181641,0,58
63    76    50678    0    1.79688,0,58
63    77    3605    0    48.4395,0,58
63    80    4363    0    59.3086,0,58
63    81    4505    0    37.6094,0,58
63    4    69    1
64    75    50566    0    0,0,47
64    4    70    1
65    75    50566    0    0.181641,0,47
65    76    50678    0    1.79688,0,47
65    87    50565    0    13.7168,0,26
65    4    71    1
66    75    50566    0    8.32129,0,58
66    76    50678    0    9.93652,0,58
66    77    3605    0    11.0566,0,58
66    78    3780    0    2.13477,0,58
66    79    4069    0    2.47461,0,58
66    80    4363    0    21.916,0,58
66    81    4505    0    0.226562,0,58
66    83    3775    0    40.6445,0,58
66    84    4631    0    26.002,0,58
66    85    38905    0    14.7783,0,58
66    86    39179    0    14.7529,0,58
66    4    72    1
67    82    57053    0    0,0,38
67    4    73    1
68    75    50566    0    0,0,47
68    4    74    1
69    75    50566    0    0.181641,0,47
69    76    50678    0    1.79688,0,47
69    4    75    1
70    77    3605    0    10.9678,0,57
70    78    3780    0    2.04688,0,57
70    80    4363    0    21.8271,0,57
70    81    4505    0    0.138672,0,57
70    4    76    1
71    75    50566    0    16.7979,0,57
71    78    3780    0    2.13477,0,57
71    79    4069    0    2.47461,0,57
71    80    4363    0    21.915,0,57
71    81    4505    0    0.226562,0,57
71    77    3605    0    11.0557,0,57
71    4    77    1
72    75    50566    0    0,0,58
72    4    78    1
73    75    50566    0    0.181641,0,47
73    76    50678    0    1.79688,0,47
73    4    79    1
74    75    50566    0    0,0,47
74    4    80    1
75    4    81    1
76    4    82    1
77    4    83    1
78    4    84    1
79    4    85    1
80    4    86    1
81    4    87    1
82    4    88    1
83    4    89    1
84    4    90    1
85    4    91    1
86    4    92    1
87    92    23831    0    0,0,21
87    4    93    1
88    4    94    1
89    4    95    1
90    4    96    1
91    4    97    1
92    4    98    1
93    117    54041    0    0,0,36
93    4    118    1
94    96    38532    0    0,0,27
94    7    38539    0    31.5801,0,33
94    4    117    1
95    22    7160    0
95    4    105    1    0,0,-267
96    12    7135    0    0,0,8
96    4    6    1
97    38    51215    0    0,0,16
97    4    101    1
98    26    54209    0
98    4    29    1    0,0,-65
99    118    4340    0    0,0,23
99    4    115    1
100    119    54041    0    0,0,42
100    4    113    1
101    11    54666    0    0,0,57
101    4    112    1
102    120    4340    0    0,0,23
102    4    110    1
103    17    18300    0    0,0,14
103    4    109    1
104    17    18300    0    0,0,14
104    4    108    1
105    75    50566    0    0.181641,0,58
105    76    50678    0    1.79688,0,58
105    77    3605    0    50.2783,0,58
105    78    3780    0    41.3564,0,58
105    79    4069    0    41.6963,0,58
105    80    4363    0    61.1377,0,58
105    81    4505    0    39.4482,0,58
105    83    3775    0    79.8662,0,58
105    85    38905    0    30.085,0,58
105    86    39179    0    30.0596,0,58
105    87    50565    0    13.7168,0,37
105    88    39541    0    122.283,0,58
105    89    50716    0    78.1494,0,58
105    90    50723    0    85.582,0,58
105    91    50933    0    101.122,0,58
105    4    100    1
106    95    18968    0
106    4    22    1    0,0,-308
107    108    18968    0
107    4    20    1    0,0,-306
108    22    7160    0
108    4    107    1    0,0,-267
109    22    7160    0
109    4    106    1    0,0,-267
110    98    5    0
110    4    28    1    0,0,-99
111    113    54041    0    0,0,29
111    31    15804    0    19.6719,0,88
111    32    16305    0    150.771,0,88
111    4    104    1
112    113    54041    0    0,0,29
112    31    15804    0    18.1396,0,88
112    32    16305    0    149.238,0,88
112    4    103    1
113    33    16244    0    38.0127,0,59
113    34    16289    0    44.9023,0,59
113    97    16292    0    5.64453,0,59
113    36    16357    0    6.07715,0,59
113    37    16387    0    0.00585938,0,59
113    4    37    1
114    38    51215    0    0,0,16
114    4    102    1
115    105    21686    0    1.01562,0,41
115    42    7620    0    65.7979,0,52
115    43    10415    0    64.4219,0,52
115    44    10722    0    48.3379,0,52
115    45    10759    0    53.4268,0,41
115    46    20723    0    0.449219,0,52
115    47    21685    0    14.8555,0,52
115    48    21768    0    54.4844,0,52
115    49    21803    0    69.7998,0,52
115    50    21804    0    69.8867,0,42
115    51    21810    0    67.0898,0,42
115    52    22171    0    60.0791,0,52
115    53    22178    0    62.79,0,31
115    54    22486    0    36.417,0,52
115    55    22553    0    34.8633,0,52
115    56    22830    0    31.583,0,41
115    57    22932    0    29.9863,0,52
115    58    22933    0    27.332,0,52
115    59    22953    0    12.5303,0,41
115    60    22955    0    68.1846,0,41
115    61    23429    0    58.1494,0,34
115    62    23853    0    114.925,0,58
115    63    24042    0    15.7715,0,41
115    64    24193    0    72.707,0,52
115    65    24409    0    15.0625,0,52
115    66    24412    0    15.9814,0,41
115    67    24458    0    115.332,0,61
115    68    24552    0    58.6768,0,52
115    69    24630    0    50.2676,0,52
115    70    24631    0    50.6279,0,42
115    71    24641    0    49.4531,0,42
115    72    27693    0    52.5645,0,41
115    73    28148    0    63.8174,0,52
115    74    41469    0    78.5195,0,52
115    4    45    1
116    75    50566    0    0.181641,0,58
116    76    50678    0    1.79688,0,58
116    77    3605    0    50.2783,0,58
116    78    3780    0    41.3564,0,58
116    79    4069    0    41.6963,0,58
116    80    4363    0    61.1377,0,58
116    81    4505    0    39.4482,0,58
116    83    3775    0    79.8662,0,58
116    85    38905    0    30.085,0,58
116    86    39179    0    30.0596,0,58
116    87    50565    0    13.7168,0,37
116    88    39541    0    122.283,0,58
116    89    50716    0    78.1494,0,58
116    90    50723    0    85.582,0,58
116    91    50933    0    101.122,0,58
116    4    99    1
117    96    38532    0    0,0,27
117    7    38539    0    31.5801,0,33
117    4    119    1
118    11    54666    0    0,0,57
118    4    116    1
119    96    38532    0    0,0,27
119    7    38539    0    31.5801,0,33
119    4    114    1
120    11    54666    0    0,0,57
120    4    111    1


Cemil Demir

unread,
Jan 15, 2016, 2:22:49 AM1/15/16
to kaldi...@googlegroups.com
Hi,

I think, before you run kws-search, you should run the command 'kws-index-union' as

kws-index-union ark,t:index.txt ark,t:index_union.txt

In my case, it works.

--
You received this message because you are subscribed to the Google Groups "kaldi-help" group.
To unsubscribe from this group and stop receiving emails from it, send an email to kaldi-help+...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.



--

raghav...@gmail.com

unread,
Jan 15, 2016, 2:46:51 AM1/15/16
to kaldi-help, cemil...@gmail.com
Hi Cemil,

Thank you for the reply. But I am receiving this warning

WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.36719
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.36719
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.34766
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.34668
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.34375
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.34277
WARNING (kws-search:main():kws-search.cc:232) Score out of expected range: -3.33887
....

It is only a part of the warning displayed. What score is it talking about? The steps followed were
1. Lattices were given. Obtained an index file using lattice-to-kws-index
2. As mentioned by you in the previous post I had a kws-index-union run on the index created. (I hope this is for combining the index of all the lattices)
3. Keyword.fsts file generated from keyword.txt (created by me with just the list of keywords)
4. kws-search was run when I obtained the warnings above and a result file.

Is there any step that I am missing?

The content of the result file is in the following format

<keyword_searched> <number1> <number2> <number3> <number4>
...
...

Would be grateful if you could clarify what these numbers correspond to?

Thanks.

Regards,
Raghav

Guoguo Chen

unread,
Jan 15, 2016, 2:48:41 AM1/15/16
to kaldi-help
It will probably be easier if you follow the documentation (http://kaldi-asr.org/doc/kws.html) or the WSJ example (search for KWS in egs/wsj/s5/run.sh). We have scripts demonstrating how to run those commands.

On Thu, Jan 14, 2016 at 11:08 PM, <raghav...@gmail.com> wrote:
Hi,

I have been trying to use kws-search for a keyword spotting system. I have been provided with the decoded lattices. This is all I have. Hence I will have to start with the given decoded lattices and obtain a kws system. The first step I did was to obtain the index file using lattice-to-kws-index and save that file as index.idx.

Then I obtained the fsts file for the keyword (which is another input to the keyword-search) using transcripts-to-fsts (I have not used any options provided in the program). The input to this was a text file in which I just listed a set of keywords. My first question 1) Is there any specific format in which I have to prepare the text file which contained the keywords or would it be enough that I just list the keywords in the file and then save it as a text file. 2) The program did give me an output file which I had named it as keywords.fsts which contained the keyword in one line and a zero in the next line and it repeated the pattern like

keyword1
0

keyword2
0

keyword3
0
...

This does not look correct (all your keywords are empty). The input to transcripts-to-fsts should be in the "transcripts" format where each line you have something like "keywords1 100 200", where integers like 100 200 corresponds to words. You'll see this if you follow the WSJ examples.

And yes we usually call kws-index-union, that's where the "global" key is introduced.

Guoguo
 

Jan Trmal

unread,
Jan 15, 2016, 2:56:57 AM1/15/16
to kaldi-help
I think your problem is the format of keyword file -- the input should look like

KWID-1 this is a keyword
KWID-2 also this
KWID-3 and
KWID-4 this

you will then map the words using int2sym.pl to ints  and use the transcripts-to-fst to generaten the keywords.fst which has the kaldi fst archive, i.e. will look like
KWID-1
0 1 int int cost
1 2 int2 int2 cost2
1 3 int3 int3 cost3
3

KWID-2
0 1 int int cost
1 2 int2 int2 cost
2

ans so on
Be aware that the  process for OOVs is much more elaborate
y.

raghav...@gmail.com

unread,
Jan 18, 2016, 2:47:42 AM1/18/16
to kaldi-help
Hi,

Thank you.

Regards.

Raghav

raghav...@gmail.com

unread,
Jan 18, 2016, 2:48:02 AM1/18/16
to kaldi-help
Hi,

Thank you.

Regards,
Raghav
Reply all
Reply to author
Forward
0 new messages