Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

[LO Calc] Diakritisch-sensitive Suche

77 views
Skip to first unread message

Roland White

unread,
Mar 3, 2021, 10:26:23 AM3/3/21
to
(opensuse 15.2, LO Version: 6.4.5.2, Build-ID: 40(Build:2))

Bei der Erstellung meiner Datensammlung (MS Access) habe ich mir ehedem
sehr viel Mühe gegeben, diakritische Zeichen möglichst exakt zu
erfassen. Jetzt, transferiert nach calc, fällt mir dies auf die Füße;
die Suche nach:

Turangalîla findet nur Turangalîla, aber nicht Turangalila
Turangalila findet nur Turangalila, aber nicht Turangalîla
Boléro findet Boléro, aber nicht Bolero
Bolero findet Bolero, aber nicht Boléro
etc. pp.

Meistens kann ich micht halt nicht daran erinnern, mit welchen Haken,
Ösen und Gemeinheiten sich ein Herr "Janáček, Leoš" schreibt und an
welcher Stelle diese vorkommen, deswegen sind auch Platzhalter keine
Lösung.

Frage: Welche Funktion hat die verheißungsvoll klingende Such-Option
"Diakritisch-sensitiv"? Diese ändert an der beschriebenen Problematik
nichts (für mich erkennbares). Bleibt also nur die Alternative, aus
Herrn Janáček einen Janacek zu machen?

TIA und Gruß

Ro"na gut, ist vielleicht eher ein Luxusproblem"land

--
Warnung: Denken ist anstrengend und kann bei unguenstiger
Praevalenz zu unerwarteden Ergebnissen fuehren.

Thorolf

unread,
Mar 3, 2021, 11:32:15 AM3/3/21
to
Roland White schrieb:
> Bleibt also nur die Alternative, aus
> Herrn Janáček einen Janacek zu machen?

wie wär's mit 'ner zusätzlichen Spalte für Herrn "Janacek", dann findet
man beide Varianten?

Mit irgendeiner Script-Sprache könnte man das vermutlich auch
automatisch erzeugen, wenn man das als CSV hat.

--

Gruesse,

Thorolf

Siegfried Höfner

unread,
Mar 3, 2021, 12:13:32 PM3/3/21
to
Am 03.03.2021 um 16:26 schrieb Roland White:
> (opensuse 15.2, LO Version: 6.4.5.2, Build-ID: 40(Build:2))
>
> Bei der Erstellung meiner Datensammlung (MS Access) habe ich mir ehedem
> sehr viel Mühe gegeben, diakritische Zeichen möglichst exakt zu
> erfassen. Jetzt, transferiert nach calc, fällt mir dies auf die Füße;
> die Suche nach:
>
> Turangalîla findet nur Turangalîla, aber nicht Turangalila
> Turangalila findet nur Turangalila, aber nicht Turangalîla
> Boléro findet Boléro, aber nicht Bolero
> Bolero findet Bolero, aber nicht Boléro
> etc. pp.
>
> Meistens kann ich micht halt nicht daran erinnern, mit welchen Haken,
> Ösen und Gemeinheiten sich ein Herr "Janáček, Leoš" schreibt und an
> welcher Stelle diese vorkommen, deswegen sind auch Platzhalter keine
> Lösung.
>
> Frage: Welche Funktion hat die verheißungsvoll klingende Such-Option
> "Diakritisch-sensitiv"? Diese ändert an der beschriebenen Problematik
> nichts (für mich erkennbares). Bleibt also nur die Alternative, aus
> Herrn Janáček einen Janacek zu machen?

Versuch es mal mit der Option "Ähnlichkeitssuche" .

Gruß Siegfried

Eike Rathke

unread,
Mar 3, 2021, 7:47:05 PM3/3/21
to
* Roland White, 2021-03-03 15:26 UTC:
> Turangalîla findet nur Turangalîla, aber nicht Turangalila
> Turangalila findet nur Turangalila, aber nicht Turangalîla
> Boléro findet Boléro, aber nicht Bolero
> Bolero findet Bolero, aber nicht Boléro
> etc. pp.

> Frage: Welche Funktion hat die verheißungsvoll klingende Such-Option
> "Diakritisch-sensitiv"? Diese ändert an der beschriebenen Problematik
> nichts (für mich erkennbares).

Die wirkt sich z.Zt. nur auf Complex Text Layout (CTL) Sprachen (z.B.
Arabisch) aus. Fuer andere und insbesondere in Latin script geschriebene
Sprachen waeren Regeln zu unterscheiden, in welchen Sprachen welche
Buchstaben gleich zu werten sind und welche nicht.

> Bleibt also nur die Alternative, aus
> Herrn Janáček einen Janacek zu machen?

Oder mit regular expressions suchen:
Bol.ro oder spezifischer Bol[eé]ro
Turangal.la oder Turangal[iî]la

Oder die bereits vorgeschlagene Aehnlichkeitssuche, bei der aber keine
Vorgaben gemacht werden koennen, *welche* Buchstaben
hinzugefuegt/geloescht/ersetzt werden duerfen, also auch voellig
unerwartete Ergebnisse geliefert werden koennen.

Eike

--
OpenPGP/GnuPG encrypted mail preferred in all private communication.
GPG key 0x6A6CD5B765632D3A - 2265 D7F3 A7B0 95CC 3918 630B 6A6C D5B7 6563 2D3A
Use LibreOffice! https://www.libreoffice.org/

Roland White

unread,
Mar 4, 2021, 3:33:48 AM3/4/21
to
Eike Rathke <erack+nu...@posteo.de> schrieb:
> * Roland White, 2021-03-03 15:26 UTC:

[Suchbeispiele mit Sonderzeichen]

>> Frage: Welche Funktion hat die verheißungsvoll klingende Such-Option
>> "Diakritisch-sensitiv"? Diese ändert an der beschriebenen Problematik
>> nichts (für mich erkennbares).
>
> Die wirkt sich z.Zt. nur auf Complex Text Layout (CTL) Sprachen (z.B.
> Arabisch) aus. Fuer andere und insbesondere in Latin script geschriebene
> Sprachen waeren Regeln zu unterscheiden, in welchen Sprachen welche
> Buchstaben gleich zu werten sind und welche nicht.

Okay, WWG.

>> Bleibt also nur die Alternative, aus
>> Herrn Janáček einen Janacek zu machen?
>
> Oder mit regular expressions suchen:
> Bol.ro oder spezifischer Bol[eé]ro
> Turangal.la oder Turangal[iî]la

Klar. Aber wie bereits erwähnt müßte ich mich ja zunächst daran erinnern
können, ob und wo diese Sonderzeichen vorkommen (könnten). Die
betreffenden Einträge sind das Ergebnis 30jähriger Sammlertätigkeit mit
dem Schwerpunkt von Mitte der 90er bis Anfang der 2000er Jahre
("Goldgräberzeiten" auf dem Flohmarkt - weg mit Opas ollen
Gedudelplatten! ;-), oft also über zwanzig Jahre alt. Im konkreten Fall
war mir offen gestanden nicht einmal gegenwärtig, daß es einen
Buchstaben "î" überhaupt gibt...

> Oder die bereits vorgeschlagene Aehnlichkeitssuche, bei der aber keine
> Vorgaben gemacht werden koennen, *welche* Buchstaben
> hinzugefuegt/geloescht/ersetzt werden duerfen, also auch voellig
> unerwartete Ergebnisse geliefert werden koennen.

Leider. Die Ähnlichkeitssuche nach "Bolero" zeigt 319(!) der insgesamt
2792 Einträge in der markierten Spalte, die fast alle nichts (für mich
erkennbares) mit dem Gesuchten zu tun haben*.

Nun, die Welt geht nicht unter, wenn Béla Bartók künftig Bela Bartok
heißt. Oder wenn ich halt ggf. mal etwas länger suchen muß.

Danke allen für die Antworten.

Gruß

R-

*Just for fun wahllos herausgegriffene Beispiele:
Adagio für Violoncello, Streicher und Basso Continuo B-dur
Quintett für Klavier, Oboe, Klarinette, Horn und Fagott
Septett für Violine, Viola, Klarinette, Horn, Fagott, Violoncello und Kontrabass
Variationen über „Der Pfau“
Adagio und Allegro für Pianoforte & Horn
Exercises (Etüden in Form freier Variationen über ein Thema von Beethoven WoO 31)

Wo hier irnkwas wie "Bolero" versteckt sein soll, ist mir ein Rätsel...

Roland White

unread,
Mar 4, 2021, 4:38:35 AM3/4/21
to
Eike Rathke <erack+nu...@posteo.de> schrieb:
> * Roland White, 2021-03-03 15:26 UTC:

[Suchbeispiele mit Sonderzeichen]

>> Frage: Welche Funktion hat die verheißungsvoll klingende Such-Option
>> "Diakritisch-sensitiv"? Diese ändert an der beschriebenen Problematik
>> nichts (für mich erkennbares).
>
> Die wirkt sich z.Zt. nur auf Complex Text Layout (CTL) Sprachen (z.B.
> Arabisch) aus. Fuer andere und insbesondere in Latin script geschriebene
> Sprachen waeren Regeln zu unterscheiden, in welchen Sprachen welche
> Buchstaben gleich zu werten sind und welche nicht.

Okay, WWG.

>> Bleibt also nur die Alternative, aus
>> Herrn Janáček einen Janacek zu machen?
>
> Oder mit regular expressions suchen:
> Bol.ro oder spezifischer Bol[eé]ro
> Turangal.la oder Turangal[iî]la

Klar. Aber wie bereits erwähnt müßte ich mich ja zunächst daran erinnern
können, ob und wo diese Sonderzeichen vorkommen (könnten). Die
betreffenden Einträge sind das Ergebnis 30jähriger Sammlertätigkeit mit
dem Schwerpunkt von Mitte der 90er bis Anfang der 2000er Jahre
("Goldgräberzeiten" auf dem Flohmarkt - weg mit Opas ollen
Gedudelplatten! ;-), oft also über zwanzig Jahre alt. Im konkreten Fall
war mir offen gestanden nicht einmal gegenwärtig, daß es einen
Buchstaben "î" überhaupt gibt...

> Oder die bereits vorgeschlagene Aehnlichkeitssuche, bei der aber keine
> Vorgaben gemacht werden koennen, *welche* Buchstaben
> hinzugefuegt/geloescht/ersetzt werden duerfen, also auch voellig
> unerwartete Ergebnisse geliefert werden koennen.

Leider. Die Ähnlichkeitssuche nach "Bolero" zeigt 319 (statt einem!) aus
insgesamt 2792 Einträgen der markierten Spalte, und diese haben fast
alle nichts (für mich erkennbares) mit dem Gesuchten zu tun*.

Nun, die Welt geht nicht unter, wenn Béla Bartók künftig Bela Bartok
heißt. Oder wenn ich halt ggf. mal etwas länger suchen muß.

Danke allen für die Antworten.

Gruß

R-

*Just for fun wahllos herausgegriffene Beispiele:
Adagio für Violoncello, Streicher und Basso Continuo B-dur
Quintett für Klavier, Oboe, Klarinette, Horn und Fagott
Septett für Violine, Viola, Klarinette, Horn, Fagott, Violoncello und Kontrabass
Variationen über „Der Pfau“
Adagio und Allegro für Pianoforte & Horn
Exercises (Etüden in Form freier Variationen über ein Thema von Beethoven WoO 31)

Wo hier irnkwas wie "Bolero" versteckt sein soll, ist mir ein Rätsel...

Siegfried Höfner

unread,
Mar 4, 2021, 5:46:51 AM3/4/21
to
Am 04.03.2021 um 10:38 schrieb Roland White:
> Eike Rathke <erack+nu...@posteo.de> schrieb:
>> * Roland White, 2021-03-03 15:26 UTC:

[...]
> *Just for fun wahllos herausgegriffene Beispiele:
> Adagio für Violoncello, Streicher und Basso Continuo B-dur
> Quintett für Klavier, Oboe, Klarinette, Horn und Fagott
> Septett für Violine, Viola, Klarinette, Horn, Fagott, Violoncello und Kontrabass
> Variationen über „Der Pfau“
> Adagio und Allegro für Pianoforte & Horn
> Exercises (Etüden in Form freier Variationen über ein Thema von Beethoven WoO 31)
>
> Wo hier irnkwas wie "Bolero" versteckt sein soll, ist mir ein Rätsel...
>

Hallo Roland, anfangs hast du erwähnt, dass die Grundlage eine
Acess-Datenbank war. Die obigen Beispiele lassen aber nicht erkennen,
wie die Übernahme erfolgt ist. Sind das jeweils eine Zeile in einer
Spalte oder gibt es noch mehr Spalten?

Gruß Siegfried

Eike Rathke

unread,
Mar 4, 2021, 6:28:30 AM3/4/21
to
* Roland White, 2021-03-04 09:38 UTC:
> Leider. Die Ähnlichkeitssuche nach "Bolero" zeigt 319 (statt einem!) aus
> insgesamt 2792 Einträgen der markierten Spalte, und diese haben fast
> alle nichts (für mich erkennbares) mit dem Gesuchten zu tun*.

Haengt von der Grosszuegigkeit der Parameter ab, die du eingestellt
hast.

> *Just for fun wahllos herausgegriffene Beispiele:
> Adagio für Violoncello, Streicher und Basso Continuo B-dur
> Quintett für Klavier, Oboe, Klarinette, Horn und Fagott
> Septett für Violine, Viola, Klarinette, Horn, Fagott, Violoncello und Kontrabass
> Variationen über „Der Pfau“
> Adagio und Allegro für Pianoforte & Horn
> Exercises (Etüden in Form freier Variationen über ein Thema von Beethoven WoO 31)

> Wo hier irnkwas wie "Bolero" versteckt sein soll, ist mir ein Rätsel...

Z.B. Bolero -> Horn mit 2 Ersetzungen plus 2 Streichungen:
Bolero
Holero
Holern
Hoern
Horn

Eike Rathke

unread,
Mar 4, 2021, 6:32:04 AM3/4/21
to
* Eike Rathke, 2021-03-04 11:28 UTC:
> * Roland White, 2021-03-04 09:38 UTC:
>> Leider. Die Ähnlichkeitssuche nach "Bolero" zeigt 319 (statt einem!) aus
>> insgesamt 2792 Einträgen der markierten Spalte, und diese haben fast
>> alle nichts (für mich erkennbares) mit dem Gesuchten zu tun*.
>
> Haengt von der Grosszuegigkeit der Parameter ab, die du eingestellt
> hast.

Fuer deinen Fall wuerde ich Streichungen und Einfuegungen auf 0 setzen
und 1 oder 2 Ersetzungen zulassen.

Roland White

unread,
Mar 5, 2021, 3:50:48 AM3/5/21
to
Eike Rathke <erack+nu...@posteo.de> schrieb:
> * Eike Rathke, 2021-03-04 11:28 UTC:
>> * Roland White, 2021-03-04 09:38 UTC:
>>> Leider. Die Ähnlichkeitssuche nach "Bolero" zeigt 319 (statt einem!) aus
>>> insgesamt 2792 Einträgen der markierten Spalte, und diese haben fast
>>> alle nichts (für mich erkennbares) mit dem Gesuchten zu tun*.
>>
>> Haengt von der Grosszuegigkeit der Parameter ab, die du eingestellt
>> hast.
>
> Fuer deinen Fall wuerde ich Streichungen und Einfuegungen auf 0 setzen
> und 1 oder 2 Ersetzungen zulassen.

Okay, bei der Vorgabe /einer/ Ersetzung Volltreffer, bei zweien wird
außer "Boléro" auch: "Bilder einer Ausstellung (Orchesterfassung Ravel)"
gefunden, aber das wäre latür akzeptabel. Jedoch, mit dieser Einstellung
bleibt z.B. die Suche nach:

Fete-Dieu

ohne Ergebnis, obwohl der Eintrag:

Fête-Dieu à Seville (Iberia, Book I)

doch AFAIS nur /einen/ Buchstabentausch erfordert. Übrigens findet die
Suche nach:

Fête Dieu

auch nichts (und nein, die Option "Nur ganze Zellen" ist nicht aktiv).

Sapperlot! Eben gerade in der Spalte der Komponisten nach "Ravel"
gesucht und vergessen, die Ähnlichkeitssuche wieder zu deaktivieren (was
bei mir in der Praxis vermutlich der Normalfall sein würde... #-). Zeigt
dann 37 Ergebnisse von acht verschiedenen Komponisten (von "Haas, Pavel"
bis "Williams, Ralph Vaughan" =:-).

Zusammengefaßt - naja, wie sag' ich's...: Die Ähnlichkeitssuche ist für
meine Zwecke nur dann der Notnagel, wenn ich auch den Namen des
Komponisten vergessen hätte - was trotz fortgeschrittenen Alters bisher
nur sehr selten vorkommt - hm? Hat da gerade jemand "Demenz" gerufen?

Vorläufig lasse ich die seinerzeit mühsam erfassten diakritischen
Zeichen mal drin. Vielleicht steht ja die Such-Option
"diakritisch-sensitiv" oder etwas ähnliches irnkwann mal in latin zur
Verfügung.

Danke und Gruß

R-

Roland White

unread,
Mar 5, 2021, 3:51:20 AM3/5/21
to
Siegfried Höfner <nom...@invalid.invalid> schrieb:
> Am 04.03.2021 um 10:38 schrieb Roland White:
>> Eike Rathke <erack+nu...@posteo.de> schrieb:
>>> * Roland White, 2021-03-03 15:26 UTC:

[...]

>> Adagio für Violoncello, Streicher und Basso Continuo B-dur
>> Quintett für Klavier, Oboe, Klarinette, Horn und Fagott
>> Septett für Violine, Viola, Klarinette, Horn, Fagott, Violoncello und Kontrabass
>> Variationen über „Der Pfau“
>> Adagio und Allegro für Pianoforte & Horn
>> Exercises (Etüden in Form freier Variationen über ein Thema von Beethoven WoO 31)
>>
>> Wo hier irnkwas wie "Bolero" versteckt sein soll, ist mir ein Rätsel...
>>
>
> Hallo Roland, anfangs hast du erwähnt, dass die Grundlage eine
> Acess-Datenbank war. Die obigen Beispiele lassen aber nicht erkennen,
> wie die Übernahme erfolgt ist. Sind das jeweils eine Zeile in einer
> Spalte oder gibt es noch mehr Spalten?

Die Spalte "Werk" enthält die Benennungen der Musikstücke und (nur
diese) wurde markiert. Es handelt sich also um die Inhalte von jeweils
einer Zelle aus dieser Spalte. Jedes Stück (hier: Bolero) kommt nur in
einer Zeile vor.

Gruß

R-
0 new messages