當 readHTMLTable 遇見 中文網址

208 views
Skip to first unread message

Hen-Chao Chang

unread,
Jul 29, 2016, 3:50:58 AM7/29/16
to R軟體使用者論壇
當 readHTMLTable 遇見 中文網址
> library(XML)
> url <- "http://udn.com/news/story/7316/1859740-透天厝失火-一家三口亡"
> readHTMLTable(url)
named list()

有些中文網址會出現
> readHTMLTable(url)
Error in nchar(els[[1]]) : invalid multibyte string, element 1

請問如何解決?非常謝謝!
Message has been deleted

WEPA ^_^

unread,
Jul 29, 2016, 11:18:33 AM7/29/16
to R軟體使用者論壇
Hi Hen-Chao,

此訊息可能是 Windows 編碼問題, 試著設定 Sys.setlocale("LC_ALL", "C"), 參考以R程式碼, 欄位名稱與資料格式須再調整:


# title: Error in nchar(els[[1]]) : invalid multibyte string, element 1
# date : 2016.7.29

# 設定系統地區
Sys.setlocale("LC_ALL", "C")
library(XML)

urls <- "http://e-service.cwb.gov.tw/HistoryDataQuery/MonthDataController.do?command=viewMain&station=467571&stname=新竹&datepicker=2016-07"

mylist <- readHTMLTable(urls)
length(mylist)
names(mylist)
mydf <- mylist$MyTable
mydf <- mydf[-c(1,2),]
head(mydf)
# end


Hen-Chao Chang於 2016年7月29日星期五 UTC+8下午10時21分24秒寫道:
> readHTMLTable(url)
Error in nchar(els[[1]]) : invalid multibyte string, element 1

誠心尋求幫助。非常謝謝!


Hen-Chao Chang於 2016年7月29日星期五 UTC+8下午3時50分58秒寫道:

Hen-Chao Chang

unread,
Jul 29, 2016, 11:56:02 AM7/29/16
to R軟體使用者論壇
非常非常感謝!

WEPA ^_^於 2016年7月29日星期五 UTC+8下午11時18分33秒寫道:

Hen-Chao Chang

unread,
Jul 29, 2016, 8:43:33 PM7/29/16
to R軟體使用者論壇
WEPA ^_^ 兄:
      非常謝謝!繼續請教,亂碼如何回復到正常?

> head(mydf)
  V1      V2      V3      V4                V5      V6                V7    V8    V9               V10   V11               V12   V13 V14
3  1 1017.4Â 1022.8Â 1019.8Â 2015-01-01 22:20Â 1014.9Â 2015-01-01 03:08Â 16.5Â 18.5Â 2015-01-01 01:25Â 14.4Â 2015-01-01 22:04Â 10.1Â 66Â
4  2 1018.4Â 1023.8Â 1020.4Â 2015-01-02 09:34Â 1016.4Â 2015-01-02 14:46Â 16.3Â 17.9Â 2015-01-02 10:27Â 14.6Â 2015-01-02 00:10Â 10.5Â 69Â
5  3 1016.4Â 1021.8Â 1018.9Â 2015-01-03 09:29Â 1014.4Â 2015-01-03 23:59Â 17.7Â 20.0Â 2015-01-03 10:06Â 16.0Â 2015-01-03 06:13Â 11.8Â 69Â
6  4 1012.2Â 1017.6Â 1014.4Â 2015-01-04 00:01Â 1010.6Â 2015-01-04 23:35Â 19.1Â 21.8Â 2015-01-04 11:24Â 17.0Â 2015-01-04 00:43Â 13.9Â 72Â
7  5 1009.9Â 1015.2Â 1012.0Â 2015-01-05 09:15Â 1008.3Â 2015-01-05 15:07Â 20.7Â 23.5Â 2015-01-05 11:55Â 18.3Â 2015-01-05 02:03Â 15.0Â 70Â
8  6 1009.5Â 1014.8Â 1010.9Â 2015-01-06 08:26Â 1008.0Â 2015-01-06 13:19Â 21.3Â 23.9Â 2015-01-06 12:00Â 19.4Â 2015-01-06 23:16Â 17.0Â 76Â
  V15               V16   V17 V18   V19  V20               V21  V22  V23  V24 V25  V26 V27  V28   V29    V30   V31  V32
3 59Â 2015-01-01 10:35Â 15.6Â 20Â 24.8Â  30Â 2015-01-01 14:36Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 9.2Â 86.1Â 14.81Â  8.5Â 6.8Â
4 64Â 2015-01-02 00:13Â 11.2Â 20Â 20.5Â  10Â 2015-01-02 00:26Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 2.7Â 25.2Â  7.81Â 13.0Â 3.4Â
5 63Â 2015-01-03 12:33Â  5.8Â 10Â 11.1Â  10Â 2015-01-03 03:58Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 7.4Â 69.2Â 13.74Â 18.8Â 3.1Â
6 64Â 2015-01-04 22:45Â  5.0Â 20Â  8.4Â 360Â 2015-01-04 13:08Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 9.6Â 89.7Â 15.06Â 20.0Â 3.3Â
7 58Â 2015-01-05 09:08Â  4.6Â 30Â  8.4Â  10Â 2015-01-05 17:47Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 4.3Â 40.1Â 12.18Â  8.0Â 3.1Â
8 69Â 2015-01-06 08:49Â  6.6Â 30Â 15.0Â  20Â 2015-01-06 21:57Â 0.0Â 0.0Â 0.0Â   Â 0.0Â   Â 1.5Â 14.0Â  9.96Â 17.5Â 3.7Â

WEPA ^_^於 2016年7月29日星期五 UTC+8下午11時18分33秒寫道:

Hen-Chao Chang

unread,
Jul 30, 2016, 12:47:41 AM7/30/16
to R軟體使用者論壇
再次求救!所抓取的資料無法存成 xls file。非常感謝!
(package : XLConnect )

 > writeWorkbook(wb,aa,startRow=10,startCol=2,header=FALSE)
錯誤: 沒有這個函數 "writeWorkbook"


Hen-Chao Chang於 2016年7月30日星期六 UTC+8上午8時43分33秒寫道:
Reply all
Reply to author
Forward
0 new messages