الزملاء الأعزاء في مجموعة SIGARAB،
نود مشاركتكم إطلاق منصة DataBayt AI Studio (v1.3.0)، وهي منصة توسيم بيانات (Data Annotation) مفتوحة المصدر(لقطات شاشة في الأسفل)، صُممت خصيصاً لمعالجة التحديات التقنية التي تواجه الباحثين عند التعامل مع اللغة العربية وخصائصها الفريدة (RTL).
نعلم جميعاً أن أدوات التوسيم العالمية تفتقر غالباً لدعم حقيقي للواجهات العربية، مما يرفع من "الحمل الإدراكي" على الموسّمين ويؤثر على دقة البيانات وسرعة الإنجاز. تهدف هذه المنصة لسد هذه الفجوة عبر توفير بيئة عمل عربية بالكامل.
أبرز مميزات المنصة للجانب البحثي:
دعم RTL أصيل: واجهة مستخدم تحترم اتجاه اللغة العربية في كافة المهام (NER, Text Classification, QA).
قياس الجودة (IAA): حساب نسب الاتفاق بين الموسّمين لضمان منهجية علمية في بناء المجموعات (Datasets).
قوالب جاهزة لـ NLP: توفير الوقت في إعداد المشاريع البحثية.
التوسيم المسبق (AI Pre-labeling): ربط مباشر مع نماذج (OpenAI, Anthropic, وغيرها) لتوليد توسيمات أولية
مفتوحة المصدر





