Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Such-Skript, das nur in bestimmten Bereichen von Dokumenten sucht

0 views
Skip to first unread message

Philipp Keppler

unread,
Oct 18, 2002, 11:12:14 AM10/18/02
to
Hallo zusammen!

Ich wollte auf einer von mir betreuten Homepage ein CGI-Skript
einbauen,
das die HTML-Dokumente nach Stichworten durchsucht und entsprechende
Ergebnisse anzeigt.

Soweit klappt das auch, ABER: die Seiten werden komplett durchsucht,
d.h. auch was reines HTML ist, wird als Treffer gewertet
(z.B.: Suchwort "html" lässt alle(!) Seiten anzeigen,
da ja in jeder Datei der HTML-Tag "<html>" ganz am Anfang steht)

Ähnlich ist es mit den Worten, welche in der Navigationsleiste
vorkommen:
da ich konsequent auf Frames verzichtet und stattdessen CSS verwendet
habe,
spuckt das Skript auch Wörter aus, die im Browser zwar zu sehen sind,
allerdings nur als Link in der Navigationsspalte fungieren und somit
überhaupt keinen
korrekten Treffer für die aktuell angezeigte HTML-Seite darstellen.

Ich hätte da zwar schon einen Lösungsansatz, doch kann ich ihn
aufgrund mangelnden
CGI-Wissens nicht anwenden, und hoffe daher auf Eure Hilfe:
Der eigentliche Inhalt (also weder die HTML-Tags noch die Wörter, die
zur CSS-Navigation gehören)
stehen auf allen Seiten innerhalb der Tags
"<!-- Beginn des eigentlichen Inhaltes -->"
und
"<!-- Ende des Inhaltes -->"

Kennt Ihr ein CGI-Suchskript, das nur innerhalb bestimmter Tags (halt
der beiden obigen) sucht
oder könnte mir jemand ein frei verfügbares Skript entsprechend
umschreiben??
Ich bin nämlich echt am Verzweifeln!

Tausend Dank schon einmal im Voraus!

-Philipp


Bernd Muent

unread,
Oct 18, 2002, 11:43:07 AM10/18/02
to
> Ich wollte auf einer von mir betreuten Homepage ein CGI-Skript
> einbauen,
> das die HTML-Dokumente nach Stichworten durchsucht und entsprechende
> Ergebnisse anzeigt.
>
> Soweit klappt das auch, ABER: die Seiten werden komplett durchsucht,
> d.h. auch was reines HTML ist, wird als Treffer gewertet
> (z.B.: Suchwort "html" lässt alle(!) Seiten anzeigen,
> da ja in jeder Datei der HTML-Tag "<html>" ganz am Anfang steht)
>
> CGI-Wissens nicht anwenden, und hoffe daher auf Eure Hilfe:
> Der eigentliche Inhalt (also weder die HTML-Tags noch die Wörter, die
> zur CSS-Navigation gehören)
> stehen auf allen Seiten innerhalb der Tags
> "<!-- Beginn des eigentlichen Inhaltes -->"
> und
> "<!-- Ende des Inhaltes -->"

Installier Dir htdig (http://www.htdig.org) und erfinde nicht das Rad neu.
htdig hat sogar genau solche index/noindex - Attribute, die Du für die ganze
Seite oder Teile eintragen kannst.

Bernd

--
Bernd Münt Durchwahl: 030/69032-509
euroscript Language Services GmbH Zentrale: 030/69032-300
Abteilung IT-Management Fax: 030/69032-333
Grimmstr. 23 Mail: mu...@euroscript-ls.de
10967 Berlin Web: http://www.euroscript-ls.de

0 new messages