Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

HTML RSS Feed www.opn.no

2 views
Skip to first unread message

Thierry Matthey

unread,
Sep 14, 2005, 8:16:39 AM9/14/05
to
Her er konfig for Firefox og infoRSS extension
(http://inforss.mozdev.org/installation.html).
Lage en OPN feed med "New Feed" ( ) xml (x) html

Regular Expression: <span class=\"style6\">([^<]*)<a
href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)

Headline: $1

Body: $4

Published date: $3

Link: http:www.opn.no/$2

NB: Regular Expression skal vaere en linje.
-Thierry

Thierry Matthey

unread,
Sep 15, 2005, 1:22:22 AM9/15/05
to
> Regular Expression: <span class=\"style6\">([^<]*)<a
> href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)

opps, skal vaere:
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)

-Thierry

Torbjørn Kravdal

unread,
Sep 15, 2005, 2:57:24 AM9/15/05
to
Thierry Matthey skrev:

Flott! Dette må jeg prøve. Veit du om noe slikt er mulig i Thunderbird,
som jeg pleier å bruke til RSS feeds?


--
Torbjørn

Thierry Matthey

unread,
Sep 15, 2005, 4:22:38 AM9/15/05
to
> Flott! Dette må jeg prøve. Veit du om noe slikt er mulig i Thunderbird,
> som jeg pleier å bruke til RSS feeds?

du kan installere infoRSS i selve Thunderbird, men ser ikke noe mulighet
for aa faa det under "News & Blogs".

en mulig kunne jo vaere aa lage noe perlskript som tar en url, regexp,
etc ... og sender tilbake en RSS XML ;-)

-Thierry

Haavard Tveite

unread,
Sep 15, 2005, 9:38:09 AM9/15/05
to
Thierry Matthey wrote:
> opps, skal vaere:
> <span
> class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)

Artig.
Jeg har lite erfaring med bruk av regular expressions, men
jeg lurte på om en kanskje kunne matche "body" bedre med:
"style13\">(.*?)</span>

Modifisert regex:
<span class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>

--
Håvard Tveite
Department of Mathematical Sciences and Technology, UMB
Drøbakveien 14, POBox 5003, N-1432 Ås, NORWAY
Phone: +47 64965483 Fax: +47 64965401 http://www.umb.no/imt

Thierry Matthey

unread,
Sep 15, 2005, 9:58:01 AM9/15/05
to
> Artig.
> Jeg har lite erfaring med bruk av regular expressions, men
> jeg lurte på om en kanskje kunne matche "body" bedre med:
> "style13\">(.*?)</span>
>
> Modifisert regex:
> <span
> class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>

godt poeng, men er nok litt usikker om det gaar gjennom, vet bare at
hvis du forer en XML RSS med <a href= ... el. gaar det ikke.

det jeg vet at det ikke fungerer som jeg er vant fra perl :-)

-Thierry

Haavard Tveite

unread,
Sep 15, 2005, 10:02:09 AM9/15/05
to
Thierry Matthey wrote:
>> Artig.
>> Jeg har lite erfaring med bruk av regular expressions, men
>> jeg lurte på om en kanskje kunne matche "body" bedre med:
>> "style13\">(.*?)</span>
>>
>> Modifisert regex:
>> <span
>> class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
>
>
>
> godt poeng, men er nok litt usikker om det gaar gjennom, vet bare at
> hvis du forer en XML RSS med <a href= ... el. gaar det ikke.

Jeg har bare testet den modifiserte regex'en i min Firefox 1.0.4, og
her gir den meg mer av body på de tilfellene jeg har testet.

Thierry Matthey

unread,
Sep 15, 2005, 10:44:24 AM9/15/05
to
skal fungere:

Thierry Matthey

unread,
Sep 19, 2005, 2:28:56 AM9/19/05
to
Haavard Tveite wrote:

> <span
> class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>

tja, etter noen timer begynte jeg aa bli litt irritert og tro at
"(.*?)</span>" gjoer min nettleser ufattelig treg naar det parses
opn.no, da vil jeg heller ha litt mindre tekst ;-)

-Thierry

0 new messages