Estoy construyendo una librería que tiene como tarea, leer los PDF y convertir los datos a DBF, estoy tratando de leer los PDF tal como indica el manual de Adobe (
https://opensource.adobe.com/dc-acrobat-sdk-docs/standards/pdfstandards/pdf/PDF32000_2008.pdf) esto es usar la tabla de referencia de objetos, cargar objeto por objeto, descomprimir si esta comprimidos los datos del stream, etc. y leer LABEL por LABEL. Ya he podido convertir algunos PDF a DBF, estoy atascado en los PDF de versiones superiores a 1.5 (en especial 1.7) las tablas de referencia viene comprimidas, al descomprimir y leer tal como dice el manual, casi todas las referencia a los objetos son exactas, pero hay algunas referencias que no coinciden con la ubicación del objeto, y la diferencia con su posición real es exactamente de 256 caracteres. Es decir la ubicación que dice la tabla es por ej. 621, pero su ubicación real es 365, la diferencia 256, este problema se da en los PDF que tiene tablas de referencia codificadas y el objeto contenedor de la tabla trae un sub-objeto DecodeParms con un campo Predictor de valor 12. Lastimosamente el manual no habla casi nada de esto y menos tiene un ejemplo de este tipo. Alguien tiene alguna sugerencia de porque puede darse esta diferencia exacta de 256 caracteres?
Cualquier sugerencia, agradecería mucho, y mas si leen el manual la parte de Cross-reference, y me hace notar algo que tal vez no este yo logrado entender, mas agradecido aún.