怎樣對csv檔案中的文字進行分詞 再將分詞結果放在同一csv檔案中?

17 views
Skip to first unread message

TITUS CHEN

unread,
Jul 30, 2017, 4:07:52 AM7/30/17
to jiebaR 中文分词, George Nee

您好,小弟是R語言的新手,現有一csv檔案,我想將text欄位的文字(有152筆)加以分詞,然後將分詞的結果放在同一個csv檔案中,並能對應原先的text欄位。不知這樣的工作要如何完成呢?


小弟已能進行分詞,只是不知如何將分詞結果放回csv檔案中。


之所以需要這樣做,是因為下一步要使用stm進行其他工作。


謝謝您的協助!


i...@qin.wf

unread,
Aug 1, 2017, 12:01:24 PM8/1/17
to jiebaR 中文分词, george...@gmail.com
您好!可以将词用空格分隔,合并为一段字符串, 然后再写入 csv 文件中。

paste(c("一","个","例子"), collapse = " ")

stringr::str_split("一 个 例子", " ")

在 2017年7月30日星期日 UTC+8下午4:07:52,TITUS CHEN写道:

TITUS CHEN

unread,
Aug 5, 2017, 4:23:38 AM8/5/17
to jiebaR 中文分词, george...@gmail.com, i...@qin.wf
您好,

小弟使用了您的程式碼,發現成功了一半。我已能夠產生字符串,但是寫入csv文件後,發現全部的字符串都重複地出現在每個欄位中。在下的需求,是將152個文檔的分詞結果,按其原先檔案位置分別放在152個對應的cell之中,以便能夠對照到其他的metadata。請問閣下,這有可能做到嗎?跪謝!

TCC
Reply all
Reply to author
Forward
0 new messages