Account Options

  1. Sign in
The old Google Groups will be going away soon, but your browser is incompatible with the new version.
Google Groups Home
« Groups Home
Message from discussion Arabisch schreiben
The group you are posting to is a Usenet group. Messages posted to this group will make your email address visible to anyone on the Internet.
Your reply message has not been sent.
Your post was successful
 
From:
To:
Cc:
Followup To:
Add Cc | Add Followup-to | Edit Subject
Subject:
Validation:
For verification purposes please type the characters you see in the picture below or the numbers you hear by clicking the accessibility icon. Listen and type the numbers you hear
 
Tor-Einar Jarnbjo  
View profile   Translate to Translated (View Original)
 More options Feb 25 2003, 3:55 pm
Newsgroups: de.etc.sprache.misc
From: "Tor-Einar Jarnbjo" <b...@pobox.com>
Date: Tue, 25 Feb 2003 21:54:12 +0100
Local: Tues, Feb 25 2003 3:54 pm
Subject: Re: Arabisch schreiben
Jens Müller <jens.muel...@ira.uka.de> wrote in
news:desm.1046196142.fsf@debian.jens.unfaehig.de:

>> Das stimmt nicht ganz. Unciode hat zusätzlich zu dem normalen Bereich
>> für Arabisch (0600-06ff) auch zwei Erweiterungen mit arabischen
>> "Präsentationsformen", wo verschiedene Glyphen für Wortanfang, Mitte,
>> Ende und auch Ligaturen eigene Codepoints haben (fb50-fdff und
>> fe70-feff).

> Ah, OK, wieder was gelernt. Was war der Grund dafür?

Aus dem Unicode-FAQ:

Q: Is it necessary to use the presentation forms that are defined in
Unicode?

A: No, it is not necessary to use those presentation forms.  Those forms
were selected and identified in the early days of developing Unicode when
sophisticated rendering engines were not prevalent. A selected subset of
the presentation forms was included to provide users with a simple method
to generate them.

Es sind also Überbleibsel, aus einer Zeit wo die Satzalgorithmen nicht so
weit entwickelt waren, dass man ohne auskommen konnte/wollte. Es wird auch
streng davon abgeraten, die Präsentationsformen zu verwenden, weil sie eine
ganze Menge Probleme machen, wenn man in Texten suchen, sortieren oder
vergleichen will. Ein Schrifttyp kann für das gleiche Zeichen mehrere
Glyphen enthalten, und es ist eigentlich Aufgabe des Satzsystemes darauf zu
achten, dass an der richtigen Stelle die richtigen Glyphen verwendet
werden, genauso wie die Entscheidung zu treffen in welche Richtung der
Textfluss gerade geht. Im letzten Fall wäre es aber sinnvoll, wenn Unicode
auch Steuerzeichen hätte, um die Textrichtung anzugeben, weil es in einem
"Mischfall" oft zu Zweideutigkeiten kommt. Ich kann zwar kein Hebräisch und
folgender HTML-Code macht bestimmt keinen sprachlichen Sinn, wird aber von
IE und Opera falsch dargestellt:

&#x05df;&#x05e0;&#x05e4;: (&#x05e0;&#x05e2; 2003).

Obwohl Hebräisch von rechts nach links geschrieben wird, wird der HTML-Code
immer von links nach rechts geschrieben, ( ist immer die öffnende Klamme
und soll wie ) angezeigt werden und Zahlen werden von links nach rechts
gelesen. Eine korrekte Darstellung auf Hebräisch wäre also (Hebräische
Zeichen mit # wiedergegeben):

.(2003 ##) ###

Der IE wechselt korrekt vor dem Zahl die Schreibrichtung, macht aber nach
dem Zahl ganz verkehrt weiter:

2003 ##) :###).

Um es richtig hinzukriegen, muss der IE ganz genau erklärt bekommen wie es
aussehen soll:

<span dir="RTL">&#x05df;&#x05e0;&#x05e4;: (&#x05e0;&#x05e2;</span>
<span dir="LTR">2003</span>
<span dir="RTL">).</span>

Opera7.0 setzt beide Varianten falsch (alles von links nach rechts), aber
Mozilla schafft auch ohne Hilfe nur die Zahl zu drehen.

Es gibt übrigens auch eigene Code-Points für die lateinischen Ligaturen fi,
fl, ffi, ffl und so weiter.

Gruß, Tor


 
You must Sign in before you can post messages.
To post a message you must first join this group.
Please update your nickname on the subscription settings page before posting.
You do not have the permission required to post.