Re: Investigación en Compresión de Archivos PDF

49 views
Skip to first unread message

Enzo Camargo

unread,
Mar 12, 2014, 2:34:00 AM3/12/14
to sp...@googlegroups.com, Programacion FIIS
Pf espero sea posible mejorar el contenido del aviso previo antes de divulgarlo.Muchas Gracias,
Atte,


2014-03-11 23:00 GMT-07:00 Enzo Camargo <enz...@gmail.com>:

Hola estimados amigos:


Estamos trabajando en desarrollar un  proyecto de investigación en compresión de archivos pdf (reducción del peso), es decir, una compresión del 70% significa que si un archivo pesa originalmente 100Mb, este pueda ser reducido al menos a 30Mb, con la misma calidad y nitidez.


Usos: menor uso de espacio en disco, facilidad en transmisión de archivos, entre otros.

El reto es lograr un 90% en la compresión, considerando los diferentes tipos de pdfs que existen, entre otros factores.


Quisiéramos saber si alguien está trabajando una solución igual o similar o en su defecto si le interesa como tema de investigación con la finalidad de colaborar en este proyecto.


Muchas gracias,

Atte,

 

-- 
Enzo Camargo Fernández - Baca




--
Enzo Camargo Fernández - Baca

Enzo Camargo

unread,
Mar 12, 2014, 2:00:45 AM3/12/14
to sp...@googlegroups.com, Programacion FIIS

Rudy Godoy

unread,
Mar 12, 2014, 10:44:00 AM3/12/14
to Sociedad Peruana de Computación
Hola Enzo,

la efectividad o ratio de compresión va relacionada con el tipo de algoritmo que se emplea. En tu caso necesitas un algoritmo de tipo “lossless” porque no se quiere perder ninguna parte de la información en el PDF. Por ejemplo, LZMA es un algoritmo de este tipo y es un poco mas eficiente que ZIP. Se usa por la aplicación 7-Zip.


--
--
Para enviar mensajes al grupo: sp...@googlegroups.com
Para retirarse del grupo: spc-l-un...@googlegroups.com
Para mas opciones: http://groups.google.com/group/spc-l?hl=es
---
Has recibido este mensaje porque estás suscrito al grupo "Sociedad Peruana de Computación (SPC)" de Grupos de Google.
Para anular tu suscripción a este grupo y dejar de recibir sus mensajes, envía un mensaje a spc-l+un...@googlegroups.com.
Para acceder a más opciones, visita https://groups.google.com/d/optout.

Yvan Tupac

unread,
Mar 12, 2014, 11:58:07 AM3/12/14
to sp...@googlegroups.com
Estimado Enzo.

¿Ya las logrado un ratio compactación de 70% para PDFs? Considerando que PDF ya usa algunas estrategias para reducir su tamaño como figuras en formatos comprimidos y textos compactados.

Algo que puedes hacer (y que muchos programas de compactación de pdf ofrecen) es:
sacar del pdf fuentes complejas o fuentes comunes en el sistema (arial, times new roman, etc), analizar (reducción de dpi, uso de compresión adecuada al gráfico (si es bw o color, fotográfico, etc), retirar etiquetas inútiles (del soft que generó el pdf), quitar algunas capas.


Saludos


_____________________________________________________
DSc. Yván Jesús Túpac Valdivia (TÚPAC, Y. J.)
Professor, Researcher
School of Computer Science
San Pablo Catholic University (UCSP)
Arequipa-Peru mailto: ytu...@ucsp.pe
http://www.ucsp.edu.pe/~ytupac
_____________________________________________________

Enzo Camargo Fernández-Baca

unread,
Mar 14, 2014, 1:05:36 PM3/14/14
to sp...@googlegroups.com, Yvan Tupac
Buenos días:

Muchas gracias por sus comentarios y aportes, Rudy e Yvan, 
Si estamos considerando los algoritmos lossless, trabajo con capas, filtros, entre otros.

Yvan: Si en algunos tipos de PDFs hemos logrado compresiones mayores a 70% inclusive un poco mas 90% en PDFs con imágenes aunque en otros tipos de archivos PDF (mas contenido de letras), es lo que estamos trabajando. La variedad de PDFs es bastante grande.

Sabemos que una empresa americana ha logrado mas del 90%, y deben estar usando su propia tecnología, me refiero algoritmos mejorados, etc.
Si alguien desea participar en esta iniciativa, por favor se ponen en contacto con nosotros.

Muchas gracias nuevamente,
Atte,
Reply all
Reply to author
Forward
0 new messages