R בעברית- בעיות שונות בניסיון בטעינת קבצים עם עברית או הצגת עברית בR באופן כללי

97 views
Skip to first unread message

198...@gmail.com

unread,
Mar 14, 2021, 8:28:42 AM3/14/21
to Israel R User Group
שלום לכולם,
יש לי קבצים קבים עם נתונים בעברית או שמות בעברית.
עד היום הכל עבד חלק בלי אף בעיה.
לאחר פירמוט והתקנה מחדש של R וRstudio
משהו נשבר בסקרפיטים, ואני לא ככ מבין מה.
אני לא זוכר איזושהי התעסקות עם זה בעבר.
כדי להדגים את הבעיה, ראו צילומסך מלמטה, בתיקייה עם שלושה קבצים הסקריפט ושני קבצים CSV עם כותרת בעברית.

בעוד שאני רואה את השמות כמו שצריך בצד ימין למטה וגם יכול לרשום בסקריפט, כשאני פותח גרשיים ומחפש קבצים עי השלמה אוטומטית אני מקבל את הג'יבריש 

בנוסף, גם סטרינגס שנראים טוב בקונסולה ובסקריפט מוזנים לסביבה בג'יבריש (למשל=X)

האם יש למישהו רעיונות?
אני יודע שדאטה בעברית זה לא אופטימלי אבל זה הדאטה שיש לי...

תודה מראש!
אור


Capture.PNG

Jonathan Rosenblatt

unread,
Mar 14, 2021, 1:18:09 PM3/14/21
to israel-r-...@googlegroups.com
האם תוכל לזקק את מהות הבעייה:
- כתיבה בעברית בעורך של Rstudio?
- ייבוא קובץ עם עברית? 
- שימוש ביכולות החיפוש של RStudio? 

הואיל והבעייה התחילה כאשר התקנת מחדש, אני משוכנע שהפתרון טמון במציאת התפריט שבו אתה מבקש להשתמש בencoding של UTF8. כל השאלה היא איזה תפריט אתה צריך. 

יונתן

--
You received this message because you are subscribed to the Google Groups "Israel R User Group" group.
To unsubscribe from this group and stop receiving emails from it, send an email to israel-r-user-g...@googlegroups.com.
To view this discussion on the web visit https://groups.google.com/d/msgid/israel-r-user-group/47f897bf-379a-4931-ac7a-513ef62e4795n%40googlegroups.com.


--
--
Jonathan Rosenblatt
Dept. of Industrial Engineering and Management
Ben Gurion University of the Negev

Or Avishay Rizi

unread,
Mar 14, 2021, 1:33:10 PM3/14/21
to israel-r-...@googlegroups.com
הי יונתן, 
תודה על התגובה!
האם רואים את התמונה ששלחתי?

אני יכול להקליד בעברית בr
כשאני שומר strings לסביבה זה נשמר כקוד של התווים.

שיחקתי עם setlocale ללא הצלחה וגם שיניתי גם את options-code-saving לutf8.

יש בעיה בקריאת קבצי csv בעברית דרך read.csv
Xlsx דרך חבילת readxl

וגם טעינה של אובייקטיבי r שמכילים עברית 

נשמע לי מאד הגיוני שזה עניין encoding אבל טרם מצאתי איפה...



Jonathan Rosenblatt

unread,
Mar 14, 2021, 1:41:32 PM3/14/21
to israel-r-...@googlegroups.com

Or Avishay Rizi

unread,
Mar 14, 2021, 2:06:40 PM3/14/21
to israel-r-...@googlegroups.com
הי, ניסיתי את כל מה שהציעו בשרשור ללא הצלחה...
תודה!

Or Avishay Rizi

unread,
Mar 14, 2021, 3:27:29 PM3/14/21
to israel-r-...@googlegroups.com
מצאתי פתרון חלקי ומצרף אותו כאן לטובת חיפושים עתידיים, עם זאת, השאלה עדיין פתוחה :)

בעת הפעלת הR זה מה שאני מקבל:
> Sys.getlocale()
[1] "LC_COLLATE=English_Israel.1252;LC_CTYPE=English_Israel.1252;LC_MONETARY=English_Israel.1252;LC_NUMERIC=C;LC_TIME=English_Israel.1252"
> options("encoding")
$encoding
[1] "native.enc"

> l10n_info()
$MBCS
[1] FALSE

$`UTF-8`
[1] FALSE

$`Latin-1`
[1] TRUE

$codepage
[1] 1252

$system.codepage
[1] 1252

בדקתי את כל הקומבינציות של encoding ו setlocale
כאשר  הencoding מקבל את אחת האפשרויות הבאות:("native.enc","UTF-8","UTF-8-BOM")
ו setlocale  את האפשרויות האלו: "Hebrew","en_US.UTF-8","English_United States.1252","Hebrew_Israel.1255"

השילוב הבא מקרב אותי מאד,
Sys.setlocale("LC_ALL", "Hebrew")
options(encoding ="UTF-8-BOM")

x<-"בדיקה"
נראה תקין בסביבה, וגם מצליח לקרוא csv

מה שעדיין לא עובד:
1. כשאני מחפש קובץ בקונסול ע"י פתיחת גרשיים ולחיצת טאב, קבצים בעברית עדיין מופיעים כסמיני שאלה.
2. וחבילת readxl מחזירה שגיאת
Error: Evaluation error: zip file 'שם_קובץ_בעברית.xlsx' cannot be opened.

תודה!


Jonathan Rosenblatt

unread,
Mar 15, 2021, 1:13:35 AM3/15/21
to israel-r-...@googlegroups.com

Or Avishay Rizi

unread,
Mar 15, 2021, 2:26:19 AM3/15/21
to israel-r-...@googlegroups.com
סליחה על ההטרדה, פוסט אחרון בנושא:
הבעיה נבעה מהencoding של ווינדוס-
אפשר לראות את זה אחרי שמריצים
l10n_info()
וקיבלנו
$system.codepage
[1] 1252

הפתרון הוא שינוי הlocale של ווינדוס- זה לא משפיע על התצוגה של מערכת ההפעלה, מבצעים את השינוי ב:

Control Panel -> Region -> Administrative -> Change System Locale" -> Hebrew(Israel)

לאחר מכן, לא הייתי צריך לשנות את הencoding ובסטינגס שלי מספיק להשתמש ב-sys.setlocale

יום נעים וUTF-8 לכולם

Reply all
Reply to author
Forward
0 new messages