You can only go upto 4 single 8 bit represnted compound character and then halant has to be inserted!
For example carefully look at ज्ञ in the following -
क्श्ज्ञ्य क्ष्स्ज्ञ्य (हलन्त नोट करें)
क्श्ज्ञ्य में हलन्त क्यों नही लगा?
क्ष्श्ज्ञ्य में हलन्त क्यों लगा?
जबकी ज्ञ्य में हलन्त क्यों नही लगा??
ज्ञ्य = (ज + ञ) + हलन्त + य = ज्ञ + हलन्त + य = ज्ञ्य = ३ बाईट
क्ष्ज्ञ्य [४ बाईट = (क + ष) + हलन्त + (ज + ञ) + हलन्त + य; हलन्त रिप्लेस हो जाते है आधे अक्षर से टोटल ४ ]
क्प्ज्ञ्य (४ बाईट = क + प + ज्ञ + य - सेम स्टोरी )
क्श्ज्ञ्य (४ बाईट टोटल देखिये क होने पर हलन्त नही लगता)
क्ष्स्ज्ञ्य (६ बाईट टोटल ४ बाईट क + ष + स + ज्ञ [String full] + १ बाईट का हलन्त + य; अत: चार बाईट के बाद हलन्त ज्ञ के आगे लग गया)
ठीक वैसे ही
प्स्ज्ञ्य - ४
प्र्स्ज्ञ्य - ६
प्स्ज्ञ्यि - संभव है
प्र्स्ज्ञ्यि - अलग है और प्र्स्ज्ञिय अलग है प+र+ज+ञ+य पे इ की मात्रा संभव ही नही है!
सो बिहाईन्ड द सीन ४ बाईट जुड कर एक कोड बनता है जिसका अपना रिप्रेजेंटेशन है. ऐसे हर ४ बाईट वाले कोड का रिप्रेजेंटेशन है! यह utf-8 का नीयम है ऐसे हर रिप्रेसेन्टेशन को रिवर्स इन्जीनियर किया जा सकता है.
for more info on this read the following links -
वैसे तो मैने पूरी लिस्ट देखी थी साईट नही मिल रही है!!
ई-स्वामी