# pkg_info -Ix iconv
libiconv-1.13.1_1 A character set conversion library
# echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
iconv: (stdin):1:0: cannot convert
Почему не работает транслитерация?
Eugene
--
Последствия-шмаследствия!
On Mon, 20 Dec 10 16:46:49 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
EG> # pkg_info -Ix iconv
EG> libiconv-1.13.1_1 A character set conversion library
EG> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
EG> iconv: (stdin):1:0: cannot convert
EG> Почему не работает транслитерация?
А должно?
Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.
Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
распоследний - 7.79-2000).
/yury
EG>> # pkg_info -Ix iconv
EG>> libiconv-1.13.1_1 A character set conversion library
EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
EG>> iconv: (stdin):1:0: cannot convert
EG>> Почему не работает транслитерация?
YI> А должно?
Да.
YI> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.
//TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
поведения. Они документированы в man iconv_open.
YI> Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
YI> распоследний - 7.79-2000).
Можно и sed-ом, только он тормоз :-)
Интересно выяснить, почему не работает в iconv.
Eugene
--
Live fast, die young. Пенсионный фонд РФ.
On Mon, 20 Dec 10 18:47:07 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.
EG> //TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
EG> поведения. Они документированы в man iconv_open.
А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
Hо можно добавить.
Так что ГОСТ в помощь... ;)
YI>> Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
YI>> распоследний - 7.79-2000).
/yury
О©╫О©╫О©╫ workaround - О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫ uconv О©╫О©╫ devel/icu.
--
Andriy Gapon
YI> Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>>> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.
EG>> //TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
EG>> поведения. Они документированы в man iconv_open.
YI> А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
YI> Hо можно добавить.
В каком месте нашел? Я ещё не RTFS :-)
YI> Так что ГОСТ в помощь... ;)
Вот блин :-)
Eugene
--
Поэты - страшные люди. У них все святое.
20 Dec 10, Andriy Gapon writes to Eugene Grosbein:
>> EG>> libiconv-1.13.1_1 A character set conversion library
>> EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
>> EG>> iconv: (stdin):1:0: cannot convert
>> EG>> Почему не работает транслитерация?
>> YI> А должно?
>>
>> Да.
AG> Как workaround - попробуй uconv из devel/icu.
о, работает
echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
huj
но частично
echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
Conversion from Unicode to codepage failed at output byte position 0. Unicode:
017e Error: Invalid character found
... А ваших pезидентов мы на пpеpываниях пеpевешаем!
Ага, нет вот такой буквы в ascii:
http://en.wikipedia.org/wiki/%C5%BD
Почему такая транслитерация - вопрос не ко мне.
http://en.wikipedia.org/wiki/ISO_9
uconv еще поддерживает Russian-Latin/BGN:
http://en.wikipedia.org/wiki/BGN/PCGN_romanization_of_Russian
--
Andriy Gapon
On Mon, 20 Dec 10 20:57:45 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>> А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
YI>> Hо можно добавить.
EG> В каком месте нашел? Я ещё не RTFS :-)
Если я правильно понял FS - lib/translit.def. Там уже предусмотрено
место для кириллицы (пока пустое). Потом из этого translit.def нужно
сгенерить lib/translit.h. Таджет для генерации живёт в Makefile.devel.
Подробнее не смотрел.
/yury
SO> Hello Andriy!
SO> 20 Dec 10, Andriy Gapon writes to Eugene Grosbein:
>>> EG>> libiconv-1.13.1_1 A character set conversion library
>>> EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
>>> EG>> iconv: (stdin):1:0: cannot convert
>>> EG>> Почему не работает транслитерация?
>>> YI> А должно?
>>>
>>> Да.
AG>> Как workaround - попробуй uconv из devel/icu.
SO> о, работает
SO> echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO> huj
SO> но частично
SO> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO> Conversion from Unicode to codepage failed at output byte position 0. Unicode:
SO> 017e Error: Invalid character found
converters/konwert
kopusha:~% echo жопа | konwert koi8r-ascii
zhopa
kopusha:~% echo йух | konwert koi8r-ascii
jukh
--
Mikolaj Golub
20 Dec 10, Mikolaj Golub writes to Slawa Olhovchenkov:
AG>>> Как workaround - попробуй uconv из devel/icu.
SO>> о, работает
SO>> echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO>> huj
SO>> но частично
SO>> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO>> Conversion from Unicode to codepage failed at output byte position 0.
SO>> Unicode: 017e Error: Invalid character found
MG> converters/konwert
MG> kopusha:~% echo жопа | konwert koi8r-ascii
MG> zhopa
MG> kopusha:~% echo йух | konwert koi8r-ascii
MG> jukh
неправильный у тебя х.
... Лучше скажи мало, но хорошо.
MG>> converters/konwert
MG>> kopusha:~% echo жопа | konwert koi8r-ascii
MG>> zhopa
MG>> kopusha:~% echo йух | konwert koi8r-ascii
MG>> jukh
SO> неправильный у тебя х.
Зато "skhodit' na" более читабельно чем "shodit' na".
--
Mikolaj Golub
21 Dec 10, Mikolaj Golub writes to Slawa Olhovchenkov:
MG>>> converters/konwert
MG>>> kopusha:~% echo ���� | konwert koi8r-ascii
MG>>> zhopa
MG>>> kopusha:~% echo ��� | konwert koi8r-ascii
MG>>> jukh
SO>> ������������ � ���� �.
MG> ���� "skhodit' na" ����� ���������� ��� "shodit' na".
��������
... Computers make very fast, very accurate mistakes
Забавно. Старый lynx в локали koi8-r показывает в этой статье "Ж", а новые
графические браузеры - "Z" с птичкой.
Вал. Дав.