يستخدم هذا المكون مكتبة Gensim. لمزيد من المعلومات حول Gensim راجع موقعها الرسمي على الويب والذي يتضمن برامج تعليمية وشرحًا للخوارزميات.
تحويل الكلمات إلى متجهات أو متجهات الكلمات هو عملية معالجة اللغة الطبيعية (NLP). تستخدم العملية نماذج اللغة لتعيين الكلمات إلى مساحة متجهة. تمثل مساحة المتجه كل كلمة بواسطة متجه من الأرقام الحقيقية. كما أنه يسمح للكلمات ذات المعاني المماثلة بتمثيلات مماثلة.
من بين العديد من تقنيات تضمين الكلمات في هذا المكون قمنا بتنفيذ ثلاث طرق مستخدمة على نطاق واسع. Two وWord2Vec وFastText هي نماذج تدريب عبر الإنترنت. والآخر هو نموذج مدرب مسبقًا glove-wiki-gigaword-100.
يتم تدريب نماذج التدريب عبر الإنترنت على بيانات الإدخال الخاصة بك. يتم تدريب النماذج المدربة مسبقًا دون اتصال على مجموعة نص أكبر (على سبيل المثال Wikipedia وGoogle News) التي تحتوي عادة على حوالي 100 مليار كلمة. ثم يظل تضمين الكلمات ثابتًا أثناء تحويل الكلمات. توفر نماذج الكلمات المدربة مسبقًا فوائد مثل تقليل وقت التدريب ومتجهات كلمات مشفرة أفضل وتحسين الأداء العام.
نموذج GloVe المدرب مسبقًا هو glove-wiki-gigaword-100. إنها مجموعة من المتجهات المدربة مسبقًا استنادًا إلى مجموعة نص Wikipedia والتي تحتوي على 5.6 مليار رمز مميز و400,000 كلمة مفردة غير محددة. يتوفر تنزيل PDF: GloVe: Global Vectors for Word Representation.
نظرًا لأن هذا المكون ينشئ مفردات من النص يختلف محتوى الأعمدة ما يؤدي إلى محتويات مفردات مختلفة. لهذا السبب يقبل المكون عمود هدف واحد فقط.
بالنسبة لحجم نافذة السياق حدد الحد الأقصى للمسافة بين الكلمة التي يتم التنبؤ بها والكلمة الحالية. يتوافق هذا الإعداد مع المعلمة window في Gensim.
في Minimum word count قم بتوفير الحد الأدنى لعدد الكلمات. سيتجاهل المكون كافة الكلمات التي لها تردد أقل من هذه القيمة.
يوضح المثال التالي كيفية عمل مكون تحويل Word إلى متجه. يستخدم تحويل Word إلى متجه مع الإعدادات الافتراضية إلى مجموعة بيانات Wikipedia SP 500 المعالجة مسبقًا.
تحتوي مجموعة البيانات على عمود فئة إلى جانب النص الكامل الذي تم جلبه من Wikipedia. يعرض الجدول التالي بعض الأمثلة التمثيلية.
يحتوي الجدول التالي على إخراج هذا المكون مع أخذ مجموعة بيانات Wikipedia SP 500 كمدخل. يشير العمود الموجود في أقصى اليسار إلى المفردات. يتم تمثيل متجه التضمين الخاص به بقيم الأعمدة المتبقية في الصف نفسه.
في مكون تحويل Word إلى متجه قدمنا ثلاث استراتيجيات مختلفة: نموذجان للتدريب عبر الإنترنت ونموذج واحد مدرب مسبقًا. تستخدم نماذج التدريب عبر الإنترنت مجموعة بيانات الإدخال الخاصة بك كبيانات تدريب وتنشئ المفردات ومتجهات الكلمات أثناء التدريب. النموذج المدرب مسبقًا مدرب بالفعل بواسطة مجموعة نص أكبر بكثير مثل Wikipedia أو نص Twitter. النموذج المدرب مسبقًا هو في الواقع مجموعة من أزواج الكلمات/التضمين.
يلخص نموذج GloVe المدرب مسبقًا مفردات من مجموعة بيانات الإدخال وينشئ متجه تضمين لكل كلمة من النموذج المدرب مسبقًا. دون التدريب عبر الإنترنت يمكن أن يوفر استخدام نموذج مدرب مسبقًا وقت التدريب. لديه أداء أفضل خاصة عندما يكون حجم مجموعة بيانات الإدخال صغيرًا نسبيًا.
بشكل عام يتم تعيين طول تضمين الكلمة إلى بضع مئات. على سبيل المثال 100 200 300. يعني حجم التضمين الصغير مساحة متجهة صغيرة ما قد يتسبب في تضارب تضمين الكلمات.
عندما يكون لديك جدول واحد في تنسيق PDF ترغب في نسخه إلى Word قد تجد صعوبة في العثور على طريقة فعالة للقيام بذلك. على عكس نسخ الجدول من Word إلى Word لا يمكنك ببساطة استخدام أمر النسخ واللصق لنسخ الجدول من PDF إلى Word مباشرة.
إذا كنت ترغب في العثور على حل فعال لكيفية نسخ الجداول من PDF إلى Word يجب عليك متابعة القراءة. نحن متأكدون أنك يمكنك العثور على ما تحتاجه.
أفضل طريقة لنسخ ولصق جدول من PDF إلى Word دون فقدان التنسيق هي استخدام UPDF. يوفر ميزة التحويل التي يمكن أن تساعدك في تحويل PDF إلى Word دون فقدان التنسيق. من خلال هذه الميزة يمكنك نسخ ولصق الجدول من PDF إلى Word بسهولة.
ما يميزها هنا هو أنها تحتوي على ميزة OCR التي تسمح لك بنسخ الجداول من PDF ممسوح ضوئيًا إلى Word وميزة التحويل بالدفعة التي يمكن أن تساعدك في نسخ الجداول من جميع ملفات PDF إلى Word في وقت واحد.
إذا كنت مهتمًا بكيفية نسخ الجدول من PDF لهذه السيناريوهات الثلاثة باستخدام UPDF يمكنك النقر على الزر أدناه لتنزيل UPDF على جهاز الكمبيوتر الخاص بك ومتابعة الدلائل أدناه لنسخ الجدول من PDF إلى Word.
افتح UPDF على جهاز الكمبيوتر الخاص بك ثم انقر على زر "فتح ملف". سيتم فتح مستكشف الملفات على جهاز الكمبيوتر الخاص بك ويمكنك اختيار ملف PDF يحتوي على جدول ترغب في تحويله.
ستجد أن الجدول تم تحويله إلى مستند Word الخاص بك بنجاح دون فقدان التخطيط والتنسيق. يمكنك استخدام المستند الحالي المحول ويمكنك أيضًا نسخ الجدول إلى مستند Word الخاص بك.
افتح PDF في UPDF ثم قم بتحريك الماوس إلى أيقونة "OCR" وانقر عليها. ثم انقر على "إجراء OCR" حدد المكان الذي ترغب في حفظ ملف OCR عليه وانقر على "حفظ" لبدء العملية.
الآن سيتم فتح ملف PDF الممسوح ضوئياً تلقائيًا على UPDF. يمكنك النقر على أيقونة "تصدير PDF" اختيار "Word" كتنسيق الإخراج والنقر على زر "تصدير" لتحويل ملف PDF الممسوح ضوئياً إلى Word بنجاح. عندما ينتهي العملية يمكنك فتح ملف Word على جهاز الكمبيوتر الخاص بك. يمكنك نسخ الجدول إلى أي ملف Word آخر.
يمكنك تنزيل UPDF من خلال الزر أدناه إذا لم يكن مثبتًا على جهاز الكمبيوتر الخاص بك. انقر مرتين على أيقونته لفتحه. انقر على "دفعة" > "تحويل" > "إضافة ملفات" لتحديد جميع ملفات PDF التي تحتوي على الجداول التي تحتاج إليها. تأكد من أنها "Word" في تنسيق الإخراج. بعد ذلك انقر على "تطبيق" لتحويل ملفات PDF إلى ملفات Word في وقت واحد.
قد يكون لدى العديد منكم برنامج Adobe Acrobat على جهاز الكمبيوتر الخاص بكم وترغبون في معرفة ما إذا كان بإمكانكم استخدامه لنسخ جدول من PDF إلى Word. نعم يمكنكم فعل ذلك. ما عليكم سوى اتباع الخطوات أدناه لتحويل ملف PDF إلى Word ثم نسخ ولصق الجدول في Word:
الخطوة 1: العثور على ملف PDF على جهاز الكمبيوتر الخاص بكم انقر بزر الماوس الأيمن عليه واختر "فتح باستخدام > Adobe Acrobat".
يمكنكم بعد ذلك فتح مستند Word الناتج ومن ثم نسخ ولصق الجدول في مستند Word جديد. يرجى ملاحظة ومع ذلك أن هذه الطريقة ستكون مفيدة لكم فقط إذا قمتم بتسجيل الدخول إلى حساب Adobe الخاص بكم. كما أن Adobe Acrobat هو أيضًا أداة بريميوم باهظة التكلفة تحتاجون إلى شرائها لاستخدامها.
من خلال جدول المقارنة يمكنكم رؤية أن Adobe Acrobat بلا شك هو محول PDF جيد ومع ذلك فإنه معقد في الاستخدام والسعر مرتفع للغاية بالنسبة للمستخدمين الشخصيين ومستخدمي الأعمال. إذا كنتم ترغبون في الحصول على أكثر محول PDF فعالية من حيث التكلفة فإن UPDF هو خياركم الأفضل. قموا بالترقية إلى UPDF Pro الآن بخصم حصري واستخدموه على أنظمة Windows وMac وiOS وAndroid.
59fb9ae87f