Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

iconv && ASCII//TRANSLIT

484 views
Skip to first unread message

Eugene Grosbein

unread,
Dec 20, 2010, 8:46:49 AM12/20/10
to
Привет!

# pkg_info -Ix iconv
libiconv-1.13.1_1 A character set conversion library
# echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
iconv: (stdin):1:0: cannot convert

Почему не работает транслитерация?

Eugene
--
Последствия-шмаследствия!

Yury Ivliev

unread,
Dec 20, 2010, 6:53:04 AM12/20/10
to
Hi, Eugene!

On Mon, 20 Dec 10 16:46:49 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
EG> # pkg_info -Ix iconv
EG> libiconv-1.13.1_1 A character set conversion library
EG> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
EG> iconv: (stdin):1:0: cannot convert
EG> Почему не работает транслитерация?
А должно?
Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.

Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
распоследний - 7.79-2000).

/yury

Eugene Grosbein

unread,
Dec 20, 2010, 10:47:07 AM12/20/10
to
20 дек 2010, понедельник, в 14:53 KRAT, Yury Ivliev написал(а):

EG>> # pkg_info -Ix iconv
EG>> libiconv-1.13.1_1 A character set conversion library
EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
EG>> iconv: (stdin):1:0: cannot convert
EG>> Почему не работает транслитерация?

YI> А должно?

Да.

YI> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.

//TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
поведения. Они документированы в man iconv_open.

YI> Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
YI> распоследний - 7.79-2000).

Можно и sed-ом, только он тормоз :-)
Интересно выяснить, почему не работает в iconv.

Eugene
--
Live fast, die young. Пенсионный фонд РФ.

Yury Ivliev

unread,
Dec 20, 2010, 8:47:35 AM12/20/10
to
Hi, Eugene!

On Mon, 20 Dec 10 18:47:07 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.

EG> //TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
EG> поведения. Они документированы в man iconv_open.
А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
Hо можно добавить.
Так что ГОСТ в помощь... ;)

YI>> Hаверное и sed-ом сделать не трудно. Таблица есть в ГОСТ (вроде самый
YI>> распоследний - 7.79-2000).

/yury

Andriy Gapon

unread,
Dec 20, 2010, 9:56:28 AM12/20/10
to
on 20/12/2010 17:47 Eugene Grosbein said the following:
> 20 О©╫О©╫О©╫ 2010, О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫, О©╫ 14:53 KRAT, Yury Ivliev О©╫О©╫О©╫О©╫О©╫О©╫О©╫(О©╫):

>
> EG>> # pkg_info -Ix iconv
> EG>> libiconv-1.13.1_1 A character set conversion library
> EG>> # echo О©╫О©╫О©╫-О©╫О©╫О©╫-О©╫О©╫О©╫ | iconv -f koi8-r -t ASCII//TRANSLIT

> EG>> iconv: (stdin):1:0: cannot convert
> EG>> О©╫О©╫О©╫О©╫О©╫О©╫ О©╫О©╫ О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫ О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫?
> YI> О©╫ О©╫О©╫О©╫О©╫О©╫О©╫?
>
> О©╫О©╫.

О©╫О©╫О©╫ workaround - О©╫О©╫О©╫О©╫О©╫О©╫О©╫О©╫ uconv О©╫О©╫ devel/icu.

--
Andriy Gapon

Eugene Grosbein

unread,
Dec 20, 2010, 12:57:45 PM12/20/10
to
20 дек 2010, понедельник, в 16:47 KRAT, Yury Ivliev написал(а):

YI> Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>>> Hи man iconv, ни iconv -l про TRANSLIT ничего не говорят.
EG>> //TRANSLIT и //IGNORE это не имена "кодировок", это модификаторы
EG>> поведения. Они документированы в man iconv_open.

YI> А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
YI> Hо можно добавить.

В каком месте нашел? Я ещё не RTFS :-)

YI> Так что ГОСТ в помощь... ;)

Вот блин :-)

Eugene
--
Поэты - страшные люди. У них все святое.

Slawa Olhovchenkov

unread,
Dec 20, 2010, 10:24:16 AM12/20/10
to
Hello Andriy!

20 Dec 10, Andriy Gapon writes to Eugene Grosbein:

>> EG>> libiconv-1.13.1_1 A character set conversion library

>> EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT


>> EG>> iconv: (stdin):1:0: cannot convert

>> EG>> Почему не работает транслитерация?
>> YI> А должно?
>>
>> Да.

AG> Как workaround - попробуй uconv из devel/icu.

о, работает

echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
huj

но частично
echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
Conversion from Unicode to codepage failed at output byte position 0. Unicode:
017e Error: Invalid character found


... А ваших pезидентов мы на пpеpываниях пеpевешаем!

Andriy Gapon

unread,
Dec 20, 2010, 11:18:07 AM12/20/10
to
on 20/12/2010 17:24 Slawa Olhovchenkov said the following:

> но частично
> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
> Conversion from Unicode to codepage failed at output byte position 0. Unicode:
> 017e Error: Invalid character found

Ага, нет вот такой буквы в ascii:
http://en.wikipedia.org/wiki/%C5%BD

Почему такая транслитерация - вопрос не ко мне.
http://en.wikipedia.org/wiki/ISO_9

uconv еще поддерживает Russian-Latin/BGN:
http://en.wikipedia.org/wiki/BGN/PCGN_romanization_of_Russian

--
Andriy Gapon

Yury Ivliev

unread,
Dec 20, 2010, 11:02:42 AM12/20/10
to
Hi, Eugene!

On Mon, 20 Dec 10 20:57:45 +0300,
Eugene Grosbein <Eugene....@f1.n5006.z2.fidonet.org> wrote:
YI>> А, точно - упустил. Hу RTFS показывает, что кириллицы там пока нет.
YI>> Hо можно добавить.

EG> В каком месте нашел? Я ещё не RTFS :-)
Если я правильно понял FS - lib/translit.def. Там уже предусмотрено
место для кириллицы (пока пустое). Потом из этого translit.def нужно
сгенерить lib/translit.h. Таджет для генерации живёт в Makefile.devel.
Подробнее не смотрел.

/yury

Mikolaj Golub

unread,
Dec 20, 2010, 3:32:01 PM12/20/10
to

On Mon, 20 Dec 2010 18:24:16 +0300 Slawa Olhovchenkov wrote to Andriy Gapon:

SO> Hello Andriy!

SO> 20 Dec 10, Andriy Gapon writes to Eugene Grosbein:

>>> EG>> libiconv-1.13.1_1 A character set conversion library
>>> EG>> # echo бла-бла-бла | iconv -f koi8-r -t ASCII//TRANSLIT
>>> EG>> iconv: (stdin):1:0: cannot convert
>>> EG>> Почему не работает транслитерация?
>>> YI> А должно?
>>>
>>> Да.

AG>> Как workaround - попробуй uconv из devel/icu.

SO> о, работает

SO> echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO> huj

SO> но частично
SO> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO> Conversion from Unicode to codepage failed at output byte position 0. Unicode:
SO> 017e Error: Invalid character found

converters/konwert

kopusha:~% echo жопа | konwert koi8r-ascii
zhopa
kopusha:~% echo йух | konwert koi8r-ascii
jukh

--
Mikolaj Golub

Slawa Olhovchenkov

unread,
Dec 20, 2010, 3:59:46 PM12/20/10
to
Hello Mikolaj!

20 Dec 10, Mikolaj Golub writes to Slawa Olhovchenkov:

AG>>> Как workaround - попробуй uconv из devel/icu.

SO>> о, работает

SO>> echo хуй | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO>> huj

SO>> но частично
SO>> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
SO>> Conversion from Unicode to codepage failed at output byte position 0.

SO>> Unicode: 017e Error: Invalid character found

MG> converters/konwert

MG> kopusha:~% echo жопа | konwert koi8r-ascii
MG> zhopa
MG> kopusha:~% echo йух | konwert koi8r-ascii
MG> jukh

неправильный у тебя х.

... Лучше скажи мало, но хорошо.

Mikolaj Golub

unread,
Dec 20, 2010, 5:08:41 PM12/20/10
to

On Mon, 20 Dec 2010 23:59:46 +0300 Slawa Olhovchenkov wrote to Mikolaj Golub:

MG>> converters/konwert

MG>> kopusha:~% echo жопа | konwert koi8r-ascii
MG>> zhopa
MG>> kopusha:~% echo йух | konwert koi8r-ascii
MG>> jukh

SO> неправильный у тебя х.

Зато "skhodit' na" более читабельно чем "shodit' na".

--
Mikolaj Golub

Slawa Olhovchenkov

unread,
Dec 21, 2010, 12:51:46 AM12/21/10
to
Hello Mikolaj!

21 Dec 10, Mikolaj Golub writes to Slawa Olhovchenkov:

MG>>> converters/konwert

MG>>> kopusha:~% echo ���� | konwert koi8r-ascii
MG>>> zhopa
MG>>> kopusha:~% echo ��� | konwert koi8r-ascii
MG>>> jukh

SO>> ������������ � ���� �.

MG> ���� "skhodit' na" ����� ���������� ��� "shodit' na".

��������

... Computers make very fast, very accurate mistakes

Valentin Davydov

unread,
Dec 21, 2010, 5:49:26 AM12/21/10
to
> From: Andriy Gapon <a...@icyb.kiev.ua>
> Date: Mon, 20 Dec 2010 16:18:07 +0000 (UTC)

>
>> но частично
>> echo жопа | uconv -x Cyrillic-Latin -f koi8-r -t ascii
>> Conversion from Unicode to codepage failed at output byte position 0. Unicode
>:
>> 017e Error: Invalid character found
>
>Ага, нет вот такой буквы в ascii:
>http://en.wikipedia.org/wiki/%C5%BD

Забавно. Старый lynx в локали koi8-r показывает в этой статье "Ж", а новые
графические браузеры - "Z" с птичкой.

Вал. Дав.

0 new messages