Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

[XYplorer] Suche nach Dateiinhalten

49 views
Skip to first unread message

Ralf Brinkmann

unread,
Apr 10, 2021, 8:12:38 AM4/10/21
to
Hallo zusammen!

Benutzt hier noch jemand den XYplorer?

Ich habe ein Verzeichnis "e:\c't\". In diesem befinden sich 139
c't-Hefte im PDF-Format.

Ich möchte nun in diesen Dateien einen Artikel "Smaartphone statt
Webcam" mit dem XYplorer (registrierte Vollversion) suchen.

Ich stehe in dem Verzeichnis und drücke (gemäß Empfehlung) STRG-SHIFT-F.

Im Tab "Dateien suchen" wird mir unter "Ort" der Pfad angezeigt,
darunter "Unterordner einschließen" angehakt. "Name" lasse ich leer.

Im Tab "Inhalte" trage ich in das große Kästchen "Smartphone statt
Webcam" (ohne Anführungszeichen) ein und starte "Jetzt suchen". Im
Bruchteil einer Sekunde erscheint "Suche erledigt in 76,1 ms (scanned
139 Files)" und es wird kein Treffer angezeigt.

Der Artikel existiert aber in genau einem Heft mit genau diesem
Wortlaut.

Auch wenn ich bei "Dateien suchen" den "Namen" mit *.* oder *.pdf angebe
und den Suchbegriff in Anführungsreichen setze klappt es nicht. Die
Millisekundensuche dauert höchstens ein bisschen länger.

Was mache ich falsch?

Gruß, Ralf
--

Christoph Schneegans

unread,
Apr 10, 2021, 4:34:24 PM4/10/21
to
Ralf Brinkmann schrieb:

> Ich habe ein Verzeichnis "e:\c't\". In diesem befinden sich 139
> c't-Hefte im PDF-Format.
>
> Ich möchte nun in diesen Dateien einen Artikel "Smaartphone statt
> Webcam" mit dem XYplorer (registrierte Vollversion) suchen.

Die Suchfunktion in XYplorer ist mit ziemlicher Sicherheit auf
Textdateien ausgelegt. Das sind nicht nur .txt-Dateien, sondern etwa
auch .csv, .json oder .cpp. Wenn du eine Datei in einem einfachen
Text-Editor wie notepad.exe öffnen und (wenigstens einigermaßen) lesen
kannst, handelt es sich um eine Textdatei.

PDF-Dateien sind aber keine Textdateien. Ihr MIME-Typ ist deshalb auch
nicht "text/pdf", sondern "application/pdf". Selbst der Text, den ein
PDF-Betrachter anzeigt, liegt nicht so in der Datei vor wie bei einer
Textdatei. Wenn du die fragliche PDF-Datei in notepad.exe öffnest
(Achtung, nur öffnen, nicht speichern!), wirst du den gesuchten Text
auch nicht finden.

--
<https://schneegans.de/lv/> · Validator für BCP 47

Stefan Kanthak

unread,
Apr 10, 2021, 5:31:09 PM4/10/21
to
"Christoph Schneegans" <chri...@schneegans.de> schrieb:
AMEN!
Sollte XYplorer nicht von einem voellig Ahnungslosen gefrickelt worden
sein, dann verwendet der (wie der RICHTIGE Explorer) zur Inhaltssuche
die seit dem letzten Jahrtausend verfuegbare Schnittstelle "IFilter".
Dummerweise liefert Microsoft kein COM-Objekt, das diese Schnittstelle
fuer PDF-Dokumente implementiert...
Ein PDF-IFilter koennte beispielsweise vom PDF-Betrachter eines Dritt-
Anbieters (UNGLEICH Adobe: diese Klitsche ist bescheuert) installiert
worden sein.

Stefan
--
<https://www.duden.de/rechtschreibung/Kanthaken>

Ralf Brinkmann

unread,
Apr 11, 2021, 4:00:50 AM4/11/21
to
Hallo Christoph!

*Christoph Schneegans*:

> PDF-Dateien sind aber keine Textdateien. Ihr MIME-Typ ist deshalb auch
> nicht "text/pdf", sondern "application/pdf".

Ok, danke. Das klingt einleuchtend.

Ich habe gestern nochmal herumgesucht und einige englischsprachige
Hinweise gefunden, dass man einen "iFilter" braucht, der in einigen
Programmen bereits vorhanden ist und von XYplorer mitbenutzt werden
kann. Man muss dazu allerdings in den Settings des Programms etwas
nachtragen (wer soll das wissen?).

Damit ist mir dann auch eine Suche gelungen, allerdings mit ziemlich
ernüchterndem Ergebnis. Der gesuchte Text wurde in zwei PDF-Files
gefunden, aber nur dort, wo in den Fußnoten auf den originalen Artikel
hingewiesen wurde. Das Heft mit dem originalen Artikel selbst wurde
nicht entdeckt. Und die Suche hat sehr lange gedauert.

Von inzwischen vier getesteten Programmen hat der berühmte Agent Ransack
/ Filelocator Pro die Suche deutlich am schnellsten durchgeführt und
auch alle Treffer gefunden.

Gruß, Ralf
--

Ralf Brinkmann

unread,
Apr 11, 2021, 4:03:04 AM4/11/21
to
Hallo Franz!

*Franz Brannt*:

> Für den Total Commander gibt es dafür das Plugin xPDFSearch.

> <https://www.ghisler.com/deutsch.htm>
> <https://www.ghisler.com/dplugins.htm>

Ach, gibt es diesen alten Norton-Commander-Ersatz immer noch? Ich muss
gestehen, ich habe ihn damals sogar registriert, aber ich bin nie
richtig damit warm geworden. Schon in alten Norton-Zeiten nicht. Aber
vielleicht sollte ich ihn nochmal hervorkramen und installieren, um
wenigstens mal zu testen, wie er sich in dieser Sache verhält.

Danke für den Hinweis!

Gruß, Ralf
--

Claus Reibenstein

unread,
Apr 11, 2021, 7:52:52 AM4/11/21
to
Ralf Brinkmann schrieb am 11.04.2021 um 10:03:

> *Franz Brannt*:
>
>> Für den Total Commander gibt es dafür das Plugin xPDFSearch.
>
> Ach, gibt es diesen alten Norton-Commander-Ersatz immer noch? Ich muss
> gestehen, ich habe ihn damals sogar registriert, aber ich bin nie
> richtig damit warm geworden. Schon in alten Norton-Zeiten nicht.

Wann war das? Welche Version? Aktuell ist die Version 9.51 vom 25.03.2020.

Das Teil gibt es nach wie vor, und es wurde im Laufe der Jahre, die ich
ihn schon benutze, immer weiterentwickelt und verbessert. Mittlerweile
gibt es auch eine 64-Bit-Version.

Gruß
Claus

Ralf Brinkmann

unread,
Apr 11, 2021, 8:58:06 AM4/11/21
to
Hallo Franz!

*Franz Brannt*:

> Ich habe dafür den verstaubten Agent Ransack installiert, den ich von
> früher kenne (ich benutze heute Everything von voidtools).

Everything benutze ich sonst auch für alles, vor allem zum schnellen
Auffinden von Bildern (wenn die Dateinamen entsprechend stimmen). Aber
leider kann das nicht in Dateien suchen. Bzw. nur umständlich und
langsam.

> Die PDF-Volltext-Suche läuft hier mit dem Total Commander etwa gleich
> schnell wie mit Agent Ransack (Lite), geringfügig schneller.

Ok, danke, dann kann ich auch für solche Zwecke bei dem Agent Ransack
bleiben.

Gruß, Ralf
--

Thorsten Albrecht

unread,
Apr 13, 2021, 3:26:47 PM4/13/21
to
On Sat, 10 Apr 2021 14:12:37 +0200, Ralf Brinkmann wrote:

>Was mache ich falsch?

Nicht vorher die FAQ zu lesen:
https://www.xyplorer.com/faq-topic.php?id=contentsearch

Thorsten

Thorsten Albrecht

unread,
Apr 13, 2021, 3:51:24 PM4/13/21
to
On Sun, 11 Apr 2021 11:43:13 +0200, Franz Brannt wrote:

>Ralf Brinkmann schrieb:
>> *Franz Brannt*:
>
>>> Für den Total Commander gibt es dafür das Plugin xPDFSearch.
>
>> vielleicht sollte ich ihn nochmal hervorkramen und installieren, um
>> wenigstens mal zu testen, wie er sich in dieser Sache verhält.
>
>Ich habe dafür den verstaubten Agent Ransack installiert, den ich von
>früher kenne (ich benutze heute Everything von voidtools). Die
>PDF-Volltext-Suche läuft hier mit dem Total Commander etwa gleich
>schnell wie mit Agent Ransack (Lite), geringfügig schneller.

Noch erheblich schneller ist es, wenn man die indizierte Suche von
Windows nutzt. Die schlägt jedes Suchtool in Verbindung mit einem
iFilter, da Suchtools im Allgemeinen (so auch der erwähnte XYplorer)
ohne Index arbeiten und damit immer "von Null" anfangen zu suchen.

Man könnte die Windows-Suche so konfigurieren, dass sie lediglich
pdf-Dokumente indiziert - dadurch wird der Index dann nicht übermäßig
groß. Damit dauert die Suche in einem riesigen Dateibaum weniger als 1
s, sofern die Indizierung bereits abgeschlossen ist.

Standardmäßig indiziert die Windows-Suche ja sogar mp3-Dateien, was
ich etwas überflüssig finde, aber wenn man Interesse an bestimmten
ID3-Tags hat, kann auch das nützlich sein.

Eine inkrementelle Volltextsuche mit Hilfe eines Index ist übrigens
das exakte Gegenteil von "verstaubt" - nämlich absolut modern. Siehe
ElasticSearch auf Webseiten.

Thorsten

Ralf Brinkmann

unread,
Apr 15, 2021, 5:25:06 AM4/15/21
to
Hallo Thorsten!

*Thorsten Albrecht*:

> Noch erheblich schneller ist es, wenn man die indizierte Suche von
> Windows nutzt. Die schlägt jedes Suchtool in Verbindung mit einem
> iFilter, da Suchtools im Allgemeinen (so auch der erwähnte XYplorer)
> ohne Index arbeiten und damit immer "von Null" anfangen zu suchen.

Ich habe die Windows-Suche nie benutzt, weil immer wieder, auch von
Fachmagazinen, davor gewarnt wurde, dass allein das permanente
Indizieren das gesamte System ausbremst.

Gruß, Ralf
--

Takvorian

unread,
Apr 15, 2021, 6:14:36 AM4/15/21
to
Ralf Brinkmann schrieb:
Erstens wird nicht permanent indiziert, zweitens richtet man sich nicht
blind nach Behauptungen von sogenannten "Fachmagazinen", sondern macht
besser seine eigenen Erfahrungen. Es gibt jede Menge Leute, die nichts von
einem "Ausbremsen" bemerken.

Thorsten Albrecht

unread,
Apr 24, 2021, 3:02:08 PM4/24/21
to
On Thu, 15 Apr 2021 11:25:05 +0200, Ralf Brinkmann wrote:

Hallo Ralf,
wenn man den Index auf einige wichtige Ordner, die sich nicht andauern
ändern, begrenzt, bremst die Indizierung exakt gar nichts aus.
Möglicherweise sind die Voreinstellungen der Windows-Suche suboptimal,
aber das gilt für andere Voreinstellungen ebenfalls.

Du verzichtest damit auf ein extrem nützliches und vor allem schnelles
(sozusagen ein in "Nullzeit" [tm Takvi.]) reagierendes Werkzeug.

Einfach mal ausprobieren auf einem beliebigen Ordner Deiner Wahl mit
1000 PDFs drin. Dann vergleichen mit Agent Ransack & Co. Und dann
staunen.

Thorsten

Ralf Brinkmann

unread,
Apr 24, 2021, 3:40:08 PM4/24/21
to
Hallo Thorsten!

*Thorsten Albrecht*:

>>[...] Windows-Suche [...]

> wenn man den Index auf einige wichtige Ordner, die sich nicht andauern
> ändern, begrenzt, bremst die Indizierung exakt gar nichts aus.
> Möglicherweise sind die Voreinstellungen der Windows-Suche suboptimal,
> aber das gilt für andere Voreinstellungen ebenfalls.

Das kann natürlich sein.

> Du verzichtest damit auf ein extrem nützliches und vor allem schnelles
> (sozusagen ein in "Nullzeit" [tm Takvi.]) reagierendes Werkzeug.

> Einfach mal ausprobieren auf einem beliebigen Ordner Deiner Wahl mit
> 1000 PDFs drin. Dann vergleichen mit Agent Ransack & Co. Und dann
> staunen.

Habe ich natürlich ausprobiert. Ich habe das Laufwerk e:\ mit den ganzen
c't-Magazinen in die Indexierung einbezogen (140 Elemente). Windows hat
genau gar nix gefunden.

Gruß, Ralf
--

Claus Reibenstein

unread,
Apr 25, 2021, 10:40:38 AM4/25/21
to
Thorsten Albrecht schrieb am 24.04.2021 um 21:02:

> On Thu, 15 Apr 2021 11:25:05 +0200, Ralf Brinkmann wrote:
>
>> Ich habe die Windows-Suche nie benutzt, weil [...]
>
> Du verzichtest damit auf ein extrem nützliches und vor allem schnelles
> (sozusagen ein in "Nullzeit" [tm Takvi.]) reagierendes Werkzeug.

Ich auch, und zwar bewusst, da der sicher vorhandene Zeitvorteil
aufgrund meiner wohlstrukturierten Datenhaltung kaum ins Gewicht fällt.
Für mich rangiert dieses "extrem nützliche Werkzeug" unter "vollkommen
überflüssig".

Gruß
Claus

Thorsten Albrecht

unread,
Apr 25, 2021, 11:23:40 AM4/25/21
to
On Sat, 24 Apr 2021 21:40:07 +0200, Ralf Brinkmann wrote:

>*Thorsten Albrecht*:

>> 1000 PDFs drin. Dann vergleichen mit Agent Ransack & Co. Und dann
>> staunen.
>
>Habe ich natürlich ausprobiert. Ich habe das Laufwerk e:\ mit den ganzen
>c't-Magazinen in die Indexierung einbezogen (140 Elemente). Windows hat
>genau gar nix gefunden.

Bei mir funktioniert es sehr gut.

Offenbar stimmt bei Dir irgend etwas nicht mit dem iFilter. Hier ist
eine umfangreiche Anleitung zur Diagnose + Reparatur:
https://www.windowspro.de/wolfgang-sommergut/pdf-dokumente-windows-desktop-search-durchsuchen


Thorsten

Ralf Brinkmann

unread,
Apr 26, 2021, 3:02:28 PM4/26/21
to
Hallo Thorsten!

*Thorsten Albrecht*:

> Offenbar stimmt bei Dir irgend etwas nicht mit dem iFilter. Hier ist
> eine umfangreiche Anleitung zur Diagnose + Reparatur:
> https://www.windowspro.de/wolfgang-sommergut/pdf-dokumente-windows-desktop-search-durchsuchen

Ok, werde ich mir mal in aller Ruhe durcharbeiten. Vielleicht hilft's.

Gruß, Ralf
--

Ralf Brinkmann

unread,
Apr 27, 2021, 1:46:20 AM4/27/21
to
Hallo Thorsten!

*Thorsten Albrecht*:

> Offenbar stimmt bei Dir irgend etwas nicht mit dem iFilter. Hier ist
> eine umfangreiche Anleitung zur Diagnose + Reparatur:
> https://www.windowspro.de/wolfgang-sommergut/pdf-dokumente-windows-desktop-search-durchsuchen

Also, Rückmeldung:

Erstaunlicherweise war bei mir alles richtig eingetellt. Was ich bei
meinen Experimenten allerdings nicht berücksichtigt hatte, das war die
Tatsache, dass Windows zumindest beim ersten Mal ewig lange braucht, bis
es den Suchindex erstellt hat.

Die ersten 269.000 Elemente wurden ruckzuck gefunden, für den Rest hat
der Rechner fast die ganze Nacht gebraucht. Aber jetzt werden die
Einträge in PDF- oder sogar JPG-Dateien gefunden.

Ich überlege mir jetzt nur, ob ich die Indexierung auf bestimmte Dateien
beschränke, also zum Beispiel alle Dokumentdateien, oder ob ich es bei
allen Arten von Dateien als Grundeinstellung belasse.

Und mit den Operatoren muss ich mich noch beschäftigen. Windows zeigt
mir HTML-Dateien als Treffer an, obwohl ich sie mit NICHT, NOT oder <>
von der Trefferliste ausschließen wollte.

Jedenfalls schon mal danke für die Hilfe.

Gruß, Ralf
--
0 new messages