jiebaR调用用户词典出错

27 views
Skip to first unread message

ai1330...@gmail.com

unread,
May 15, 2017, 11:12:50 PM5/15/17
to jiebaR 中文分词
您好,我的分词代码如下
cutter = worker(type = "hmm",
                stop_word =  "stop_words.utf8",
                user = "user.utf8",
                bylines = TRUE)
但是每次运行,R就报错,说是session is terminated,然后R就重新启动了,不知道是什么问题,然后我测试了一下,只有停用词stop_word的时候,似乎还能运作,一加上user=就会重新启动,也就是说不知道为何无法调用user词典。请求帮助!

我有将词典复制出来到wd下,用 user = "/Users/Ed/Desktop/R/diss/user.utf8",但仍然出现这样的问题,请问是怎么了呢?在网上似乎我也没有碰到别人有这样的疑问,所以想来请教一下?


Message has been deleted

ai1330...@gmail.com

unread,
May 15, 2017, 11:14:35 PM5/15/17
to jiebaR 中文分词
对了,我忘了说,我的环境是mac,用的是R version 3.3.2 (2016-10-31)

qinwf

unread,
May 16, 2017, 12:53:20 PM5/16/17
to jiebaR 中文分词, ai1330...@gmail.com
您好,词典文件内容是什么呢?是否包含了什么特殊的字符?即 user.utf8 的内容。如果可以的话,可以把这个词典文件发给我试一下。

还有软件包的版本是什么呢?

georgene...@gmail.com

unread,
Jun 4, 2019, 9:55:19 AM6/4/19
to jiebaR 中文分词
您好!我的問題依樣相當類似,也是會出現worker 時出現terminated的問題,現在的狀況是,worker(stop_word)不起作用,Error in worker(dict = "jieba.dict.utf8", user = "D3.txt", stop_word = "S1.txt") : There is no such file for stop words. 以前沒發生過這種事,請問各位大人這該如何解決? (路徑與編碼UTF8都沒有問題,謝謝!)因為在Rstudio Cloud是可以運作的,檔案應該是沒有問題的。

謝謝!!

George敬上

George Nee

unread,
Jun 11, 2019, 10:28:39 PM6/11/19
to jiebaR 中文分词
後來還是去Rstudio Cloud解決分詞(主要是停用詞),我這邊的狀況是無論在windows還是MAC的環境下,jiebaR的分詞載入詞典中,自定詞典的dict, user都沒有問題,有問題的是stop_word,無法載入停用詞。
Reply all
Reply to author
Forward
0 new messages