הפילוסופיה הבסיסית של R היא שאת הנתונים אתה צריך להכין לה, והיא תדע לנתח אותם. זה אמנם כבר מזמן לא ממש נכון כשיש אינספור חבילות המאפשרות סקרייפינג ישיר מאתרי אינטרנט, הגשת שאילתות ישירות למאגרי מידע בSQL (ובפורמטים אחרים) וכמובן חבילות עיבוד נתונים מופלאות דוגמת dplyr ורבות אחרות. אבל עדיין, אני חושב שבראש צריך להיות שבאחריות המפתח לוודא שהנתונים יגיעו בפורמט סביר, ושR לא אמורה להתמודד עם בעיות בהשגת הנתונים עצמם. בעיקר, R לא אמורה להתמודד עם הבדלים הנובעים משגעונות של מערכות הפעלה, מהבדלי חומרה, וגם יכולתה להתמודד עם הבדלי קידוד מוגבלת יחסית (אם כי קיימת). R היא תוכנת ניתוח סטטיסטי, לא תוכנה אדמיניסטרטיבית.
אחרי הפתיח הזה, ובזהירות הנדרשת, כי אין לי באמת מושג איזה סוג נתונים ואיזה סוג ניתוחים אתה רוצה לעשות, אני יכול להגיד בבטחון די רב שR זו בחירה מצויינת לעבודה איתה לצרכים שתיארת.