¿Que es parsear html o xml ?

7815 views
Skip to first unread message

Analyzer

unread,
Aug 23, 2013, 10:31:33 AM8/23/13
to PHP Latinoamérica
Leo al menos 2 definiciones en la red del término "parsear un html/xml".

Una de ellas da la idea de "sacar información" de un html y la otra da la idea de analizar el código para ver si está correctamente escrito.

http://flanagan.ugr.es/xml/parser.htm

Recuerdo que en la materia de compiladores, la idea era de acuerdo a la segunda definición, pero en la web me desconcierta un poco el uso de la fraseología.

¿Qué sería "parsear" un html/xml?..

Saludos!

Iván Rico

unread,
Aug 23, 2013, 10:41:24 AM8/23/13
to phplatin...@googlegroups.com
Bueno primeramente "parsear" es un verbo que nos hemos inventado por que somos bien flojos para decir "analizar sintacticamente", parser viene del inglés si no me equivoco y basicamente "parsear" es una actividad que consiste en el análisis de texto para determinar si cumple o no reglas o patrones y en base a esto tomar alguna determinación

en la teoría de compiladores pues si cumple con todas esas reglas sintacticas entre otras cosas, podrá convertirlo al código objeto y al final código binario

si analizas un xml por ejemplo de alguna factura electronica, tus reglas serían cosas como si tiene impuestos, montos, cliente, proveedor, códigos, etc, y en base a eso determinas si es una factura válida o inválida

si analizas un html pues creo que algunas reglas serían si cuenta con la declaración del BODY, DOCUMENT TYPE, HEAD y ya depende de lo que estes evaluando son tus acciones a tomar

espero haber sido claro  =P



--
Has recibido este mensaje porque estás suscrito al grupo "PHP Latinoamérica" de Grupos de Google.
Visita este grupo en http://groups.google.com/group/phplatinoamerica.



--
Iván Rico

-----BEGIN GEEK CODE BLOCK-----
Version: 3.12
GE d- s:-- a-- C+++ UL++ P L++ E- W++ N- o-- K- w+
O-- M- V-- PS PE Y-- PGP- t--- 5 X R tv b- DI D----
G e+++ h! r- y+
------END GEEK CODE BLOCK------
               www.geekcode.com         

Sitio Web: http://ivan.rico.org.mx
Linux User: #340251

Analyzer

unread,
Aug 23, 2013, 10:46:57 AM8/23/13
to PHP Latinoamérica
Ivan Rico,

Bastante clara la explicación. No creo tener más dudas sobre esto.


Saludos!
Reply all
Reply to author
Forward
0 new messages