ओसीआर का महत्व पहले भी था किन्तु अब बहुत बढ़ गया है, क्योंकि सॉफ्टवेयर में टेक्स्ट को समझने की आश्चर्यजनक समता आ गयी है ( नीचे लिखा उद्धरण पढ़िए और गुनिये ) ।
इस समय ओसीआर की भरमार हो गयी है। एक से बढ़कर दूसरा। अधिकांश निःशुल्क।
Dharmamitra <https://dharmamitra.org> के बाद
Datalab का ओसीआर बहुत उपयोगी लग रहा है। इसका 'प्लेग्राउंड' देखिये -
इसकी मुख्य विशेषता यह है कि यह आपके डॉक्यूमेंट के संरचना (लेआउट ) को भी यथावत बनाये रख सकता है। इतना ही नहीं, यह कई फॉर्मेट (json, html, markdown आदि ) में आउटपुट दे सकता है। इसके प्लेग्राउंड का GUI इतना व्यवस्थित है कि क्या कहना ?
उद्धरण :
OCR isn’t just an extraction problem, it’s a trust boundary.
Once text becomes structured data, downstream systems treat it as truth tables turn into financial inputs,
formulas turn into calculations,
handwritten notes turn into decisions.