مجموعة بيانات أسفار

8 views
Skip to first unread message

Hesham Haroon

unread,
Apr 22, 2026, 1:31:11 PMApr 22
to SIGARAB: Special Interest Group on Arabic Natural Language Processing
السلام عليكم ورحمة الله وبركاته 
لا يُصانُ التراثُ بالشعار، وإنّما يُصانُ حين يُرفَعُ إلى طبقةٍ تقرؤه الآلةُ وتتعلَّمُ منه.
أصدرتُ اليوم مجموعةَ بيانات "أَسْفَار": مُدوَّنةٌ صفحيّةٌ مفتوحةُ المصدر لتراث العربية، مُهيَّأةٌ لتدريب النماذج اللغويّة.
١٢٣,٠٦٢ صفحة.
٤٦١ مجلّداً.
١٢١ عنواناً من أمّهات كتب اللسان والأدب والتاريخ.
فيها خزانةُ الأدب للبغداديّ، والكاملُ والمقتضَبُ للمبرّد، وأدبُ الكاتب لابن قتيبة، والغريبُ المصنَّفُ لأبي عبيد، وإصلاحُ المنطق لابن السكّيت، والفروقُ لأبي هلالٍ العسكريّ، وأسرارُ العربية لابن الأنباري، وتجريدُ الأغاني، وطبقاتٌ نادرةٌ عن جزيرة العرب ونجدٍ والأحساء.
تصلحُ لتدريب نماذجِ الأساس على لسانٍ فصيحٍ محرَّر، ولبناء مصحّحاتٍ ومحرّكاتِ تشكيل، ولتقوية منظوماتِ الاسترجاع على مصادر التراث.

المصدر من هنا 
Reply all
Reply to author
Forward
0 new messages