2. डा. ओलिवर हैल्विग के सांफ्टवेयर में इमेज तथा रूपांतरित पाठ शब्दों के बीच एक - से - एक मैपिंग की सुविधा है जिससे शब्दों को पहचानने , उन्हें शुद्ध करने में बडी सरलता हो जाती है। - विपिनयदि आप ओसीआर विकास में संलग्न हैं तो मेरा सुझाव निम्नलिखित है -1. डा.ओलिवर हेल्विग तथा गूगल द्वारा विकसित ओसीआर एक दूसरे के पूरक हैं। अभी पूर्ण कोई भी नहीं है। डा. हेल्विग के ओसीआर में विशेषता यह है कि 1. अक्षरों के घुमाव के अनुसार उनकी पहचान के अतिरिक्त, अक्षरों के युग्मों अथवा शब्दों की डिक्शनरी का प्रावधान किया गया है। यदि कोई अक्षर - युगल या शब्द डिक्शनरी में भर दिया जाएगा तो उसकी पहिचान बडी सरल हो जाएगी। जितने भी संयुक्त अक्षर व अक्षर - युग्म हैं, उनको डिक्शनरी में भरने की आवश्यकता पडी है। यह कार्य अलग से करना पडा है। अन्वेषक द्वारा प्रदत्त डिक्शनरी लगभग खाली थी। डिक्शनरी भरने से सांफ्ट वेयर की क्षमता बहुत उन्नत हो गई है और गूगल की अपेक्षा आज भी अधिक है।
- विपिनडिक्शनरी फाईलविश्वास जी,धवल जी ने डिक्शनरी फाईल का परिचय देकर काम पहले ही सरल कर दिया है। अब इस फाईल का आकार 537 केबी के बदले लगभग 570 केबी हो गया है। यदि डिक्शनरी फाईल की सुविधा आपके सांफ्टवेयर में हो जाए तो संभवतः त्रुटियों की संभावना कम रहेगी। नवीनतम डिक्शनरी फाईल निम्नलिखित वैबपृष्ठ पर उपलब्ध रहेगी -