ניתוח טקסט בעברית

43 views
Skip to first unread message

Tal Shahaf

unread,
Sep 4, 2014, 10:01:57 AM9/4/14
to israel-r-...@googlegroups.com
שלום
לניתוח טקסט בעברית - בעיקר חיפוש וספירת מילים וניתוח הנתונים R - אני שוקל אפשרות להשתמש ב
?האם יש מישהו שמנסיונו יודע שזה יכול לעבוד
האם התוכנה תדע להתמודד עם בעיות בקידוד הטקסט למשל על מחשבים עם מערכת הפעלה לא בעברית או מחשבי מק

תודה!

amit gal

unread,
Sep 4, 2014, 10:08:29 AM9/4/14
to israel-r-...@googlegroups.com
הפילוסופיה הבסיסית של R היא שאת הנתונים אתה צריך להכין לה, והיא תדע לנתח אותם. זה אמנם כבר מזמן לא ממש נכון כשיש אינספור חבילות המאפשרות סקרייפינג ישיר מאתרי אינטרנט, הגשת שאילתות ישירות  למאגרי מידע בSQL (ובפורמטים אחרים) וכמובן חבילות עיבוד נתונים מופלאות דוגמת dplyr ורבות אחרות. אבל עדיין, אני חושב שבראש צריך להיות  שבאחריות המפתח לוודא שהנתונים יגיעו בפורמט סביר, ושR לא אמורה להתמודד עם בעיות בהשגת הנתונים עצמם. בעיקר, R לא אמורה להתמודד עם הבדלים הנובעים משגעונות של מערכות הפעלה, מהבדלי חומרה, וגם יכולתה להתמודד עם הבדלי קידוד מוגבלת יחסית (אם כי קיימת). R היא תוכנת ניתוח סטטיסטי, לא תוכנה אדמיניסטרטיבית.

אחרי הפתיח הזה, ובזהירות הנדרשת, כי אין לי באמת מושג איזה סוג נתונים ואיזה סוג ניתוחים אתה רוצה לעשות, אני יכול להגיד בבטחון די רב שR זו בחירה מצויינת לעבודה איתה לצרכים שתיארת.




--
You received this message because you are subscribed to the Google Groups "Israel R User Group" group.
To unsubscribe from this group and stop receiving emails from it, send an email to israel-r-user-g...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Tal Galili

unread,
Sep 4, 2014, 10:50:53 PM9/4/14
to israel-r-...@googlegroups.com
היי עמית. 
עם החלק השני של דבריך אני מסכים בהחלט. 
החלק הראשון לא ממש יושב לי. 
יש לך איזשהם מקורות כדי לחזק את טענותך?


Sent from a smart-phone

amit gal

unread,
Sep 5, 2014, 1:34:23 AM9/5/14
to israel-r-...@googlegroups.com
" R input facilities are simple and their requirements are fairly strict and even rather inflexible. There is a clear presumption by the designers of R that you will be able to modify your input files using other tools, such as file editors or Perl to fit inwith the requirements of R"

מתוך הספר introduction to R שנכתב על ידי הcore team של המפתחים. (עמ' 30).

Message has been deleted

Amit Fliess

unread,
Sep 5, 2014, 7:45:31 AM9/5/14
to israel-r-...@googlegroups.com
לדעתי הרבה יותר פשוט להשתמש למטרות אלה ב- perl, ruby וב-unix אפשר להשתמש מלבד בפקודות unix shel גם ב- awk, sed . למיטב ידיעתי מק משתמשים בסוג של unix.


בתאריך יום חמישי, 4 בספטמבר 2014 17:01:57 UTC+3, מאת Tal Shahaf:

Jonathan Rosenblatt

unread,
Sep 5, 2014, 8:09:52 AM9/5/14
to israel-r-...@googlegroups.com
rapidMiner הוא גם כלי מחמד מאוד לטיפול בטקסט. 
--
You received this message because you are subscribed to the Google Groups "Israel R User Group" group.
To unsubscribe from this group and stop receiving emails from it, send an email to israel-r-user-g...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.


--
Jonathan Rosenblatt
www.john-ros.com


Tal Shahaf

unread,
Sep 5, 2014, 8:32:42 AM9/5/14
to israel-r-...@googlegroups.com
אוקיי, נראה לי שאני מקבל את התמונה הכללית. תודה


On Friday, September 5, 2014 2:09:52 PM UTC+2, Jonathan Rosenblatt wrote:
rapidMiner הוא גם כלי מחמד מאוד לטיפול בטקסט. 

On Friday, September 5, 2014, Amit Fliess <0fl...@gmail.com> wrote:
לדעתי הרבה יותר פשוט להשתמש למטרות אלה ב- perl, ruby וב-unix אפשר להשתמש מלבד בפקודות unix shel גם ב- awk, sed . למיטב ידיעתי מק משתמשים בסוג של unix.


בתאריך יום חמישי, 4 בספטמבר 2014 17:01:57 UTC+3, מאת Tal Shahaf:
שלום
לניתוח טקסט בעברית - בעיקר חיפוש וספירת מילים וניתוח הנתונים R - אני שוקל אפשרות להשתמש ב
?האם יש מישהו שמנסיונו יודע שזה יכול לעבוד
האם התוכנה תדע להתמודד עם בעיות בקידוד הטקסט למשל על מחשבים עם מערכת הפעלה לא בעברית או מחשבי מק

תודה!

--
You received this message because you are subscribed to the Google Groups "Israel R User Group" group.
To unsubscribe from this group and stop receiving emails from it, send an email to israel-r-user-group+unsub...@googlegroups.com.

For more options, visit https://groups.google.com/d/optout.


--
Jonathan Rosenblatt
www.john-ros.com


Reply all
Reply to author
Forward
0 new messages