Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss
Groups keyboard shortcuts have been updated
Dismiss
See shortcuts

Sorting (collation) of German texts, the Eszett case.

315 views
Skip to first unread message

moi

unread,
Feb 19, 2024, 2:55:08 AM2/19/24
to
(Archive)

An example illustrating that "ss" and "ß" are not equivalent.

Old ß form, : added for the fun.
Upper cased form : same logic, same correct result, not shown.

>>> from TriEszett import qlef
>>> a = ['Maske', 'Maß', 'Masse', 'Maße', 'Massen', 'Maßen', 'Mast', 'Maſʒe']
>>> r = sorted(a * 5, key=qlef)
>>> print(r)
['Maske', 'Maske', 'Maske', 'Maske', 'Maske', 'Maß', 'Maß', 'Maß', 'Maß',
'Maß', 'Masse', 'Masse', 'Masse', 'Masse', 'Masse', 'Maße', 'Maße',
'Maße', 'Maße', 'Maße', 'Maſʒe', 'Maſʒe', 'Maſʒe', 'Maſʒe', 'Maſʒe',
'Massen', 'Massen', 'Massen', 'Massen', 'Massen', 'Maßen', 'Maßen',
'Maßen', 'Maßen', 'Maßen', 'Mast', 'Mast', 'Mast', 'Mast', 'Mast']
>>> for e in r:
... print(e)
...
Maske
Maske
Maske
Maske
Maske
Maß
Maß
Maß
Maß
Maß
Masse
Masse
Masse
Masse
Masse
Maße
Maße
Maße
Maße
Maße
Maſʒe
Maſʒe
Maſʒe
Maſʒe
Maſʒe
Massen
Massen
Massen
Massen
Massen
Maßen
Maßen
Maßen
Maßen
Maßen
Mast
Mast
Mast
Mast
Mast

0 new messages