Regular Expression: <span class=\"style6\">([^<]*)<a
href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)
Headline: $1
Body: $4
Published date: $3
Link: http:www.opn.no/$2
NB: Regular Expression skal vaere en linje.
-Thierry
opps, skal vaere:
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)
-Thierry
Flott! Dette må jeg prøve. Veit du om noe slikt er mulig i Thunderbird,
som jeg pleier å bruke til RSS feeds?
--
Torbjørn
du kan installere infoRSS i selve Thunderbird, men ser ikke noe mulighet
for aa faa det under "News & Blogs".
en mulig kunne jo vaere aa lage noe perlskript som tar en url, regexp,
etc ... og sender tilbake en RSS XML ;-)
-Thierry
Artig.
Jeg har lite erfaring med bruk av regular expressions, men
jeg lurte på om en kanskje kunne matche "body" bedre med:
"style13\">(.*?)</span>
Modifisert regex:
<span class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
--
Håvard Tveite
Department of Mathematical Sciences and Technology, UMB
Drøbakveien 14, POBox 5003, N-1432 Ås, NORWAY
Phone: +47 64965483 Fax: +47 64965401 http://www.umb.no/imt
godt poeng, men er nok litt usikker om det gaar gjennom, vet bare at
hvis du forer en XML RSS med <a href= ... el. gaar det ikke.
det jeg vet at det ikke fungerer som jeg er vant fra perl :-)
-Thierry
Jeg har bare testet den modifiserte regex'en i min Firefox 1.0.4, og
her gir den meg mer av body på de tilfellene jeg har testet.
> <span
> class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
tja, etter noen timer begynte jeg aa bli litt irritert og tro at
"(.*?)</span>" gjoer min nettleser ufattelig treg naar det parses
opn.no, da vil jeg heller ha litt mindre tekst ;-)
-Thierry