Tamaño de los archivos en textMate

3 views
Skip to first unread message

jampov

unread,
Mar 15, 2009, 11:46:35 AM3/15/09
to TextMate en Castellano
Muy buenas a todos.

He descubierto TextMate hace unos días y principalmente lo estoy
usando como editor XHTML.
He observado que los archivos que guardo con el editor aumentan de
tamaño entre dos y tres veces, con respecto a otro editor de texto
como puede ser Taco HTML Edit.

Si dicho archivo lo copio entero y lo pego en una nueva plantilla y lo
guardo, el tamaño se reduce significativamente.

He probado a usar el comando "remove trailing space and save" pero
esto no reduce el espacio.

¿Alguno de vosotros podría decirme a que se debe esto?

Muchas gracias.

david::

unread,
Mar 15, 2009, 1:43:34 PM3/15/09
to textm...@googlegroups.com

¿Qué codificación de caracteres estás usando en ambos editores?

jampov

unread,
Mar 16, 2009, 10:00:41 AM3/16/09
to TextMate en Castellano
Tanto en el documento XHTML como al guardar el archivo, uso la
codificación UTF8.

david::

unread,
Mar 16, 2009, 10:41:07 AM3/16/09
to textm...@googlegroups.com
Guarda el documento con Taco en "1.html", y con TextMate en "2.html"

abre una terminal y haz:

cd /donde/estén/tus/archivos/que/acabas/de/crear

file 1.html
file 2.html
ls -las 1.html
ls -las 2.html
diff 1.html 2.html

a ver qué sale




2009/3/16 jampov <jam...@gmail.com>:

Diego Martin

unread,
Mar 16, 2009, 10:45:31 AM3/16/09
to textm...@googlegroups.com
Es probable que el otro editor utilice ISO-5980-1 y en Textmate use por defecto UTF-8 lo cual dobla, casi, el tamaño de los archivos.

2009/3/16 david:: <voi...@gmail.com>



--
--
Diego Martín Lafuente
CCO
Tractis - Online contracts you can enforce
http://www.tractis.com
--
Email: diego.l...@tractis.com
Skype: minidix
Blog: http://blog.negonation.com
--

Choan Gálvez

unread,
Mar 16, 2009, 11:22:35 AM3/16/09
to textm...@googlegroups.com
Hola.

On Mar 16, 2009, at 15:45 , Diego Martin wrote:

> Es probable que el otro editor utilice ISO-5980-1 y en Textmate use
> por
> defecto UTF-8 lo cual dobla, casi, el tamaño de los archivos.

Para casi doblar el tamaño casi todos los caracteres deberían estar
fuera del rango ASCII.

$ echo lorem ipsum sic dolor amet > utf-lorem.txt
$ wc -c utf-lorem.txt
27 utf-lorem.txt
$ iconv -f utf-8 -t iso-8859-1 utf-lorem.txt > iso-lorem.txt
$ wc -c *
27 iso-lorem.txt
27 utf-lorem.txt
54 total
$ echo murciélago hindú ñandú > utf-murcielago.txt
$ iconv -f utf-8 -t iso-8859-1 utf-murcielago.txt > iso-murcielago.txt
$ wc -c *mur*
23 iso-murcielago.txt
27 utf-murcielago.txt
50 total


Salud.
--
Choan

Ale Muñoz

unread,
Mar 16, 2009, 11:55:18 AM3/16/09
to textm...@googlegroups.com
Lo único que se me ocurre (así de repente) es que TextMate guarda
metadatos como la línea y posición del cursor, el lenguaje y el
folding *en* el fichero, en partes "no visibles" (por no complicar
mucho la explicación)

Desconozco si esas "partes no visibles" influyen en el tamaño que
reporta el Finder, pero creo que no. Y en línea de comandos puedo
asegurar que no incrementan el tamaño del fichero.

Dicho esto, +1 para el comentario de david. Pon un diff a ver qué sale : )


--
Ale Muñoz
http://sofanaranja.com
http://bomberstudios.com

jampov

unread,
Mar 22, 2009, 1:44:45 PM3/22/09
to TextMate en Castellano
Antes de nada quiero agradecer todas vuestras respuestas.

David: No tengo ni idea del uso del términal pero he hecho lo que tu
me sugerías y me sale esto:

mac-pro:~ jampov$ cd /Users/jampov/Desktop/
mac-pro:Desktop jampov$ file 1.html
1.html: HTML document text
mac-pro:Desktop jampov$ file 2.html
2.html: HTML document text
mac-pro:Desktop jampov$ ls -las 1.html
56 -rw-r--r-- 1 jampov staff 25855 22 mar 17:00 1.html
mac-pro:Desktop jampov$ ls -las 2.html
160 -rw-r--r--@ 1 jampov staff 25855 20 mar 00:58 2.html
mac-pro:Desktop jampov$ diff 1.html 2.html
mac-pro:Desktop jampov$

No veo diferencias en los permisos, salvo el 56 y el 160 que no se lo
que es. El comando "diff" no da ningún resultado al comparar los
archivos.

Por otro lado, he comprobado que si el archivo lo "guardo como" y lo
sobreescribo el tamaño se normaliza. Así pues, de momento será lo que
haga, ya que antes usaba siempre "cmd+S".
Seguiré haciendo pruebas porque estoy seguro que es algo que no tiene
importancia y lo estoy pasando por alto.

Si puedes me explicas los resultados de la prueba con el terminal.

Muchas gracias de nuevo y un saludo.

david::

unread,
Mar 22, 2009, 3:17:52 PM3/22/09
to textm...@googlegroups.com

Buenas

Leopard tiene una cosa que se llama "atributos extendidos": se trata
de que un archivo tiene asociado un conjunto de atributos, como por
ejemplo comentarios de Spotlight. TextMate los usa para almacenar
cosas como, por ejemplo, el último sitio donde dejaste el cursor para
que, cuando vuelvas a abrirlo, te lleve directamente allí, o trozos de
código que has plegado (fold), etc.

Es como si tu documento lo imprimes en un folio y luego le vas pegando
post-its: el documento se queda igual pero el conjunto "folio+postits"
ocupa más.

Cuando haces "mostrar información" en el finder, te dice el "tamaño en
disco" (folio + postits).

Con "ls -las" obtienes tanto el tamaño del folio como el del folio +
postits:

> mac-pro:Desktop jampov$ ls -las 1.html
> 56 -rw-r--r-- 1 jampov staff 25855 22 mar 17:00 1.html
> mac-pro:Desktop jampov$ ls -las 2.html
> 160 -rw-r--r--@ 1 jampov staff 25855 20 mar 00:58 2.html


El 56 y 160 es el tamaño "folio + postits" en bloques de 512 bytes.
¿Por qué 2.html tiene más bloques?

Fíjate en que 2.html tiene una @. Eso significa que tiene atributos
extendidos. 1.html no tiene @ así que no tiene atributos.

Pero ambos archivos ocupan 25855 bytes, así que si coges 2.html y te
lo llevas a un servidor FTP linux (que no entiende de estos atributos
extendidos), pues te ocupará 25822 bytes.

Como curiosidad, haz:

$ cd /Users/jampov/Desktop
$ xattr -l 2.html

Esto lo que hace es mostrarte los atributos extendidos del archivo.
Saldrá un choro de cosas :)

Con un poco de bash puedes borrar los atributos de un archivo, pero
perderás esa valiosa información, así que no sé si merece la pena.

En resumen: no problem, está todo controlado :P Los metadatos ocuparán
espacio en _tu_ máquina, pero te hacen la vida más fácil. Y en cuanto
cambies de sistema de archivos, los metadatos no se copian (p.ej.
guardando el archivo en un USB FAT32 o si te lo llevas a una máquina
linux con ext3) así que si cuelgas tu página web en algún sitio,
ocupará lo mismo aunque lo hayas editado con TextMate. De todas
formas, si lo deseas, puedes borrar los metadatos con un poco de bash:

file='archivo_que_quiero_limpiar_de_metadatos.txt'; for attr in `xattr
$file`; do echo "Eliminando atributo $attr"; xattr -d $attr $file; done

lo he hecho aprisa y corriendo, haz copia de tu archivo antes de
usarlo! Probablemente algún gurú de por aquí sepa hacer lo mismo en un
applescript, que sería más fácil, la verdad.

Ahora lo que me preguntabas:


El 22/03/2009, a las 18:44, jampov escribió:
>
> Antes de nada quiero agradecer todas vuestras respuestas.
>
> David: No tengo ni idea del uso del términal pero he hecho lo que tu
> me sugerías y me sale esto:
>
> mac-pro:~ jampov$ cd /Users/jampov/Desktop/
> mac-pro:Desktop jampov$ file 1.html
> 1.html: HTML document text
> mac-pro:Desktop jampov$ file 2.html
> 2.html: HTML document text

'file' te dice el tipo de archivo analizando el contenido (no el
nombre ni la extensión). En este caso, los dos archivos son del mismo
tipo.

> mac-pro:Desktop jampov$ ls -las 1.html
> 56 -rw-r--r-- 1 jampov staff 25855 22 mar 17:00 1.html
> mac-pro:Desktop jampov$ ls -las 2.html
> 160 -rw-r--r--@ 1 jampov staff 25855 20 mar 00:58 2.html

Esto ya lo sabemos :)

> mac-pro:Desktop jampov$ diff 1.html 2.html

Esto saca las diferencias. Si no saca nada, no hay diferencias.

Pues nada, espero que se haya entendido todo bien. Un saludo!
Reply all
Reply to author
Forward
0 new messages