Modulo para Consultar DNI desde Foxpro
Bueno, acá les dejo uno de los módulos que tanto he escuchado por ahí que lo necesitan.
Es una cortesía de mi parte.
Asi como lo leen completamente gratis para que lo estudien si deseen o lo adapten a sus sistemas.
Estimado Jean Pierre
Agradezco tu Gentileza.
Saludos,
Martín
Algunos sitios web requieren pasar un CAPTCHA de acceder a su contenido. Como he escrito antes de que éstos se pueden analizar utilizando la API deathbycaptcha , sin embargo, para grandes sitios web con muchos de CAPTCHA de esto se convierte en un costo prohibitivo. Por ejemplo la resolución de 1 millón de CAPTCHA de esta API con costaría $ 1,390.
Afortunadamente muchos de de CAPTCHA son débiles y se pueden resolver mediante la limpieza de la imagen y el uso de simples OCR. Estas son algunas de las imágenes de CAPTCHA ejemplo de un sitio web recientemente trabajé con:
Amablemente las marcas de distracción son más ligeros de modo que la imagen puede ser thresholded para aislar el texto:
Ahora las imágenes resultantes se pueden pasar a un programa de OCR para extraer el texto. Aquí están los resultados de 3 herramientas de OCR de código abierto populares:
Captcha 1 | Captcha 2 | Captcha 3 | Resultado | |
---|---|---|---|---|
7rrg5 | hirbZ | izi3b | ||
Tesseract | 7rrq5 | hirbZ | izi3b | 2/3 |
gocr | 7rr95 | _i_bz | izi3b | 1/3 |
ocrad | 7rrgS | hi_bL | iLi3b | 0/3 |
resultados excelentes. Conseguir el 100% de precisión no es necesaria cuando la solución del mostrado en pantalla, porque la gente real también cometen errores por lo que sitios web se acaba de responder con otro CAPTCHA de resolver.
Tesseract sólo se confunde 'g' con 'q' y Gorc pensó que 'g' era un '9', lo cual es comprensible. A pesar de que Ocrad no hay nada correcto en este pequeño grupo de muestras, que estaba cerca en todo momento. Y esto fue sin entrenar en la fuente o la fijación de la orientación del texto.
Si usted está interesado en el código Python utilizado está disponible para su descarga aquí . Depende de la PIL para el procesamiento de imagen y cada una de las herramientas de OCR.