הזמנה לארוע דאטהתון (=ניתוח נתונים) של "רכבת פתוחה"

瀏覽次數:53 次
跳到第一則未讀訊息

Tal Galili

未讀,
2014年9月9日 中午12:20:222014/9/9
收件者:israel-r-...@googlegroups.com
שלום חברי-R,
אני מכתב אתכם בהזמנה להאקטון של ניתוח נתונים שיתקיים בסוף החודש ונראה לי מעניין במיוחד עבורנו.
לצערי אני לא אוכל להגיע בזמן הזה (אני אהיה בחו"ל).
אם מישהו מכם מתכנן להגיע, אשמח אם תכתבו כאן כדי שגם אחרים ידעו. ואם יצא מזה משהו מעניין, אשמח אם תשתפו אותנו על כך ברשימת התפוצה.

להלן ההזמנה:


צוות "רכבת פתוחה" שמח להזמין לארוע הדאטה-תון, מרתון ניתוח נתוני רכבת ישראל לשנת 2013 (ורוב 2014). הארוע יתקיים ביום שלישי, ה-30.9 בין השעות 18:30-21:00 במשרדי הסדנא ברחוב קרליבך 7 (קומה ב'). רוצים לבוא? יאללה, תירשמו.

מי מוזמן?
הארוע יתמקד בניתוח ובעיבוד נתונים, ולכן אנחנו מחפשים בעיקר צוללני מידע, סטטיסטיקאים וכאלה שאוהבים לחלץ תשובות לשאלות מתוך נתונים.

אז מה נעשה שם?


קיבלנו וריכזנו את כל נתוני זמני הגעת הרכבות לתחנות בתקופה של 2013 ו- 2014 (עד אוגוסט). מדובר במעל 3 מיליון רשומות, כשכל אחת מהן מתארת עצירה של רכבת בתחנה מסוימת בישראל. הנתונים יוגשו לאורך הערב בפורמט csv, ואתם מוזמנים ללוש ולאפות אותם בעזרת הכלים החביבים עליכם.


למה בכלל אנחנו עושים את זה?


המטרה שלנו היא לנתח את הנתונים ולהוציא מהם תובנות מעניינות. המטרה שלנו כפולה:

 

1. להציג לסיפור סיפורים שמתחבאים בתוך אוסף הנתונים הזה כדי לעודד אותו להמשיך ולשאול שאלות.


2. לעזור לנו להגדיר טוב יותר מדדים ושאילתות למערכת "רכבת פתוחה" המתקרבת לרגע ההשקה הציבורית שלה. בתחילת הערב נציג בקצרה את המערכת ונדגים כמה חשובה יכולה להיות התרומה של ניתוח הנתונים הקיימים.



כמה שאלות מעניינות לדוגמא:


- האם יש הבדל בשיעורי האיחורים בין תחנות הפריפריה ומרכז הארץ?

- מהי תדירות ואורך האיחורים בימי ראשון וחמישי?

- מהי מידת האיחורים בשעות עומס ובכיווני צפיפות (לתוך ת"א בבוקר, מחוץ לת"א בערב)?

- עד כמה מייצג מדד הדיוק הרשמי של רכבת ישראל תחנות מסויימות (לוד, רמלה, בית שמש, ירושלים, נהריה ושדרות)?

- האם ישנם הבדלים בין עונות בעמידת הרכבת ביעדים?

- האם ניתן לאתר קווים בעייתיים יותר מבחינת איחורים?


להרשמה לארוע: bit.ly/opentrain-datathon
לפרטים ושאלות: blue...@gmail.com




amit gal

未讀,
2014年9月9日 中午12:37:372014/9/9
收件者:israel-r-...@googlegroups.com
יוזמה מעולה ואני אגיע.
אני משתף את השאלה שמעניינת אותי: כמה מוקדם אפשר לתת הערכה מדוייקת לזמן הגעה של רכבת לתחנה בהינתן מיקומן של כל הרכבות האחרות. כלומר גם בקרות ארוע לא צפוי של איחור/ביטול, כמה מהר אפשר לתת הערכות מתוקנות, כדי ליידע את הנוסעים הממתינים.

להתראות בסוף החודש

--
You received this message because you are subscribed to the Google Groups "Israel R User Group" group.
To unsubscribe from this group and stop receiving emails from it, send an email to israel-r-user-g...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Tal Galili

未讀,
2014年9月9日 下午4:50:272014/9/9
收件者:israel-r-...@googlegroups.com
כל הכבוד עמית!
אני אשמח לקרוא/לשמוע עידכונים :)



----------------Contact Details:-------------------------------------------------------
Contact me: Tal.G...@gmail.com
Read me: www.talgalili.com (Hebrew) | www.biostatistics.co.il (Hebrew) | www.r-statistics.com (English)
----------------------------------------------------------------------------------------------

Tal Galili

未讀,
2014年9月13日 上午11:54:032014/9/13
收件者:israel-r-...@googlegroups.com
אם מישהו מכם/ן סקרן:
אעדכן שהנתונים של זמני ההגעה והעזיבה של רכבת ישראל הועלו לאינטרנט, וניתנים להורדה בקישור הזה:

https://github.com/hasadna/OpenTrainCommunity/blob/master/results/train_data.csv.gz?raw=true1

עוד הסבר על הפרוייקט, ועל המפגש שיתקיים ב- 30 לספטמבר, מופיע בקישור הזה:

אם למישהו פה יצא לעשות משהו נחמד עם R סביב הנתונים הללו, אשמח לראות ולשתף הלאה.



----------------Contact Details:-------------------------------------------------------
Contact me: Tal.G...@gmail.com
Read me: www.talgalili.com (Hebrew) | www.biostatistics.co.il (Hebrew) | www.r-statistics.com (English)
----------------------------------------------------------------------------------------------


2014-09-09 19:20 GMT+03:00 Tal Galili <tal.g...@gmail.com>:

Ofrit Lesser

未讀,
2014年9月13日 下午5:26:332014/9/13
收件者:israel-r-...@googlegroups.com

לא התאפקתי והצצתי בנתונים.

יש שם משהו מאוד מוזר בעמודת ה depart_delay. ישנן כמה שורות של ערכים שליליים מאד גבוהים.

לדוגמא:

2672825 2014-07-01 22:52:00 2014-07-01 01:34:00        -1278    2100 Haifa Center HaShmona

 

יש גם 772 פעמים שהרכבת יצאה 20 דקות לפני הזמן, ו-4176 פעמים שהרכבת יצאה 10 דקות לפני הזמן. קצת מוזר שהרכבות מקדימות כל כך...

 

האם יתכן שהרכבת משפרת את ממוצע האיחורים שלה ע"י שימוש בנתונים שנראים קצת מפוקפקים?

 

עפרית

--

Yoav Benjamini

未讀,
2014年9月14日 凌晨2:16:312014/9/14
收件者:israel-r-...@googlegroups.com
עופרית
לפני כמה שנים טובות סטודנט שלי עשה פרויקט על נתוני הרכבת וגילה תופעה דומה.
שימי לב ש24שעות*ששים דקות = 1440 כלומר בערך הקדמה של יום.
לפי ההסברים שקיבל בזמנו התופעה נובעת מאיחור גדול שמעביר יום אבל הרישום של התאריך שגוי,
או מביטול של רכבת או של עצירתה בתחנה ואז נרשמת אולי ביקור הרכבת הקודמת.
ניראה לי שמאז לא השתנה דבר.
זו ההזדמנות ל:
1) לברר עם אנשי הרכבת התופעה ולהביא לשינוי בדרך יצירת הנתונים
2) לזכור חשיבותם של אומדים חסינים ויציבים
 (כדוגמת trimmed means(
יואב


Yoav Benjamini

The Nathan and Lily Silver Professor of Applied Statistics
Department of Statistics and Operations Research
Tel Aviv University     www.math.tau.ac.il/~ybenja






Ofrit Lesser

未讀,
2014年9月14日 凌晨2:58:262014/9/14
收件者:israel-r-...@googlegroups.com

 

אכן נכון לגבי ההקדמות במספר רב של שעות.

עדיין קיימת השאלה לגבי הקדמה של יציאות במספר דקות. רכבות לא אמורות לצאת לפני הזמן המתוכנן. גם הקדמה של זמן היציאה במספר דקות היא בעייתית לנוסע.

עפרית

回覆所有人
回覆作者
轉寄
0 則新訊息