السلام عليكم،
يسرنا (بعون الله) أن نقدم للمجتمع البحثي العربي مدونة (مجموعة بيانات) هي الأكبر والأهم من نوعها من حيث الحجم والتوسيم والتنوع لدعم مهمة التقييم الآلي لمقالات الطلبة بالمدارس الثانوية (والجامعات) المكتوبة باللغة العربية.
المدونة الجديدة اسمها "ليلى"*، وهي تضم ٨ مهمات كتابية إقناعية وتفسيرية، تتضمن ٧,٨٥٩ مقالة، تم جمعها من ٢٤ مدرسة في قطر، وكتبها ٤,٣٧٢ طالب وطالبة في المرحلة الثانوية، وشارك في توسيمها ٩ أساتذة للغة العربية من حيث ٧ سمات كتابية مختلفة: "الصلة بالموضوع" و"تطور الأفكار والمضمون" و"الأسلوب والتماسك البنائي" و"البناء والتراكيب" والإملاء والترقيم والشكل" و"المفردات" و"الهيكل العام"، إلى جانب التقييم الكلي، واستغرق ذلك كله ما يقرب من عام كامل من الإعداد والموافقات الأخلاقية والتجميع والتوسيم والتوثيق.
وما نفخر ونسعد به حقيقة أن "ليلى" تضاهي في حجمها وتوسيمها وجودتها المدونات الأجنبية المستخدمة كثيرا في أبحاث هذا المجال.
ندعو الله ونأمل أن يسهم إتاحة "ليلى" في دعم البحث والباحثين (خاصة العرب) لتطوير نظم عربية في هذا المجال البحثي، وهو ما ندر للأسف نظرا لغياب المدونات المتاحة بالأساس، رغم بدء العمل البحثي عليها في اللغات الأخرى منذ أكثر من ٥٥ عام، بل واستخدامها بالفعل في الاختبارات الدولية للغة الإنجليزية منذ أكثر من عشرين عام.
لمعرفة تفاصيل أكبر عن "ليلى"، يمكنكم قراءة (نسخة أولية من) الورقة البحثية التي قبلت (والحمد لله) في مؤتمر EACL 2026 .
http://arxiv.org/abs/2512.24235
والمدونة متاحة بالكامل للباحثين عبر رابط جيت-لاب:
https://gitlab.com/bigirqu/laila
هذا العمل أنجزه -بمجهود رائع على مدار عام- فريق كبير من الباحثين من جامعة قطر و جامعة كارنيجي-ميلون في قطر، على رأسه م. مي بشندي ود. وليد مسعود. والشكر والتقدير للتمويل البحثي المقدم
من مجلس قطر للبحوث والتطوير والابتكارQRDI))، وكذلك للتعاون الرائع من وزارة التعليم والتعليم العالي القطرية.
* المدونة سميت بـ "ليلى" لأن لنا مدونة سابقة (لكن أصغر كثيرا) اسمها "قيس"
تامر
Dear Tamer and colleagues,
Congratulations to you and the entire team on this outstanding achievement and on the acceptance of your paper at EACL 2026. This is a significant milestone for Arabic NLP and educational technology research.
For the benefit of non-Arabic speakers on SIGARAB, LAILA is a large-scale, publicly available Arabic corpus designed for automatic assessment of student writing. It includes 7,859 persuasive and expository essays written by 4,372 high-school students from 24 schools in Qatar. The essays are annotated by nine expert Arabic teachers across seven core writing dimensions, in addition to an overall score.
The corpus stands out for its size, annotation richness, and quality, making it comparable to well-known English datasets and helping to address a long-standing lack of Arabic resources in this area.
Congratulations again on this impactful contribution, and best wishes for the continued success of the project.
Best regards,
Nizar
--
You received this message because you are subscribed to the Google Groups "SIGARAB: Special Interest Group on Arabic Natural Language Processing" group.
To unsubscribe from this group and stop receiving emails from it, send an email to sigarab+u...@googlegroups.com.
To view this discussion visit https://groups.google.com/d/msgid/sigarab/CA%2BqxmxTmFRXpuz8gizuEftzcmiCyYaCogHUKUwO5SDdTz6cahg%40mail.gmail.com.
Prof. and Dean
Faculty of IT and CS | Sinai University
| +201005000702 | +201005000702 | ||
| profa...@yahoo.com ashara...@acm.org | ||
| Al-Mesaed, Arish, North Sinai, Egypt |
To view this discussion visit https://groups.google.com/d/msgid/sigarab/598566232.3600769.1767598740232%40mail.yahoo.com.
To view this discussion visit https://groups.google.com/d/msgid/sigarab/CAFfBGVniNYhdP6pQk1GLDC8Wd%2B-aPzoCMtBYHpNTQG8reGCy%2Bw%40mail.gmail.com.
To view this discussion visit https://groups.google.com/d/msgid/sigarab/CAOvunaR%2Baj%3DWfUMvmGEVumz2KOifztXGdpXQD6EZuObdsbaT9Q%40mail.gmail.com.