באישור ובעידוד טל ויונתן אני מפרסם כאן באופן חד פעמי סדנת מבוא לR שאעביר בעוד כחודש, בתאריכים 10-11/7 בתל אביב.
הסדנה בת יומיים מלאים בתשלום ומיועדת לאנשים שאין להם רקע בR (או נסיון מועט, ורוצים לבסס את הידע הזה), אבל כן עוסקים בניתוח נתונים. הסדנה הועברה בעבר לחוקרים ממגוון תחומים, בעיקר במדעי החברה (כלכלה, מדיניות ציבורית, סוציולוגיה פסיכולוגיה, מנהל עסקים, שיווק, וכו') אך רלוונטית כמובן לתחומים רבים נוספים באקדמיה ובתעשיה. היא לא תעסוק כלל בתחום של למידת מכונה ו"דאטה סיינס", אך ידע בR צפוי לעזור מאד למעוניינים להתקדם בתחומים אלה. למרות שR היא שפת תכנות לכל דבר הסדנה מועברת בגישה מאד לא תכנותית, ולכן מתאימה לאנשים חסרי כל רקע בתכנות.
הסדנה מורכבת מ4 מודולים עיקריים:
- מבוא בסיסי: הכרת סביבת העבודה, מבני נתונים בסיסיים (וקטורים, רשימות וכו') ופעולות בסיסיות עליהם, כולל טיפול בסיסי בטקסט ותאריכים.
- מניפולציה של נתונים והכנתם לניתוח: קריאה וכתיבה של נתונים ממקורות שונים. החבילה dplyr ושימושיה השונים לקידוד, מיזוג, אגרגציה וניקוי נתונים, ועוד.
- ניתוח סטטיסטי בסיסי: סטטיסטיקה תאורית, מבחנים סטטיסטיים נפוצים, רגרסיה לינארית ורגרסיה לוגיסטית
- ויזואליזציה באמצעות ggplot2
ככל שיותיר הזמן נלמד עוד כמה דברים בהתאם להעדפות המשתתפים. למשל, הרבה פעמים יוצא שאני מלמד על bootstrapping כי זה גם מרחיב את הידיעות של המשתתפים בסטטיסטיקה (למי שלא בא מהתחום) וגם מאפשר לתרגל תכנות בסיסי בR (למרות שיש חבילות שכבר עושות את זה מצויין). כמה פעמים יצא לי לדבר קצת על שאלות כמו מתי עוצרים A\B טסטינג ועוד ועוד... את זה כבר קשה להבטיח, תלוי במשתתפים ובהעדפותיהם ובקצב ההתקדמות.
זו סדנא. מעבר לחומר שאני אציג יהיו תרגילים ויהיה זמן לשאלות ואפילו אפשרות להביא את הדאטה שלכם או את הבעיות שאיתן אתם מתמודדים ולקבל עצה איך להתקדם ומה לעשות.