Buenos dias
Mirando las opciones que dieron en su momento Edgar Suarez, VFPSTEAM BI , Miguel A. y Jean Pierre Adonis en febrero de este Año, me puse a ensayarlos uno por uno, ya que en los actuales momentos tengo una necesidad puntual a este respecto.
Resulta que para organizar unos expedientes antes se hacia mediante la lectura del código de barras que trae el documento principal de la obligación el cual contenía (el código de barras) el Nit / Cédula de la entidad que pagaba (deudor) hasta ahí es fácil de indexar, pero ahora les dio por cambiar el identificador de la entidad por el numero de la obligación (factura). Por lo tanto hay que pasar considero yo (Dios quiera que alguien me diga que enfoco mal el inconveniente y sea por otro lado) el PDF a Texto para recorrerlo y sacar de ahí los datos que necesito.
Por eso me di a la tarea de ensayar las bondades de uno y otro, y espero que si alguno de ustedes tiene otra información al respecto así sea de otro programa, que funcione bien en los dos casos aunque sea de pago le estaría inmensamente agradecido.
Caso 1
Archivo PDF Generado por los bancos o cualquier entidad (ojo no escaneado) cuando se utiliza el programa
- PTCMD queda perfecto
- VFPs OCR en algunos casos sale malo (caracteres raros)
- PDFToText sale bien
-PDF2TXTOCR Sale bien
Caso 2
Archivo PDF Generado mediante un escaner
- PTCMD Sale malo toma todo como una imagen y no sirve (es mi caso puede que apersonas les sirva pero por favor me indican como)
- VFPs OCR sale bien (los documento sobre los cuales hice la prueba)
- PDFToText solo sale un caracter especial no muestra nada
- PDF2TXTOCR importa caracteres raros y el texto (no queda perfecto), pero por ahora es lo que puede servir un poco para lo que se pretende
- Hay 2 que se pueden utilizar por linea de comandos que son le Ptcmd y el PDF2TXTOCR
- El VFPs OCR es por medio de una aplicación desarrollada en VFP, se tendria que mirar la posibilidad si la persona que lo vende se pueda automatizar donde se le pasen parametros para que no deba seleccionar un archivo a la vez, sino los archivos que se encuentran en una carpeta.
- PDFToText no he podido hacerlo funcionar por linea de comandos, a pesar de que investigue y baje algunos ejemplos.
Espero no aburrirlos con esto pero vuelvo y reitero si alguno se le ocurre algo le agradecería mucho.
Saludos
Elkin Uribe
Medellin - Colombia