Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Nach jedem char ein \0

1 view
Skip to first unread message

wg

unread,
Feb 4, 2019, 10:48:10 AM2/4/19
to
Hallo allerseits,

da bekomme ich grerade ein ascii file, und greppe den String 'xml', der
mit vi sichtbar ist.
Der grep findet jedoch nix.
Beim od -bc filename sehe ich, daß nach jedem Buchstaben eine binäre
null folgt:

> od -bc file.xml | more
0000000 377 376 074 000 077 000 170 000 155 000 154 000 040 000 166 000
377 376 < \0 ? \0 x \0 m \0 l \0 \0 v \0

Ein tr -d "\0" behebt das ganze.

Meine Frage: was für eine Software erstellt sowas?

Danke,
Wolf

Peter J. Holzer

unread,
Feb 4, 2019, 12:17:44 PM2/4/19
to
On 2019-02-04 15:47, wg <w...@gmx.net> wrote:
> da bekomme ich grerade ein ascii file, und greppe den String 'xml', der
> mit vi sichtbar ist.
> Der grep findet jedoch nix.
> Beim od -bc filename sehe ich, daß nach jedem Buchstaben eine binäre
> null folgt:
>
>> od -bc file.xml | more
> 0000000 377 376 074 000 077 000 170 000 155 000 154 000 040 000 166 000
> 377 376 < \0 ? \0 x \0 m \0 l \0 \0 v \0

Also UTF-16LE.


> Ein tr -d "\0" behebt das ganze.

Glück gehabt.

Wenn in dem File ein Zeichen >= U+0100 vorgekommen wäre, hätte tr -d "\0"
nichts behoben, sondern das File kaputtgemacht.

Besser:

Mit vi öffnen, dann

:set fileencoding=utf8

eingeben und abspeichern.

Oder mit iconv umwandeln.

> Meine Frage: was für eine Software erstellt sowas?

Software, die UTF-16 verwendet. Vor allem in der Windows-Welt recht
beliebt, kommt aber auch sonst vor.

hp

--
_ | Peter J. Holzer | Fluch der elektronischen Textverarbeitung:
|_|_) | | Man feilt solange an seinen Text um, bis
| | | h...@hjp.at | die Satzbestandteile des Satzes nicht mehr
__/ | http://www.hjp.at/ | zusammenpaßt. -- Ralph Babel

wg

unread,
Feb 4, 2019, 12:20:37 PM2/4/19
to
On 04.02.2019 18:17, Peter J. Holzer wrote:
> On 2019-02-04 15:47, wg <w...@gmx.net> wrote:
>> da bekomme ich grerade ein ascii file, und greppe den String 'xml', der
>> mit vi sichtbar ist.
>> Der grep findet jedoch nix.
>> Beim od -bc filename sehe ich, daß nach jedem Buchstaben eine binäre
>> null folgt:
>>
>>> od -bc file.xml | more
>> 0000000 377 376 074 000 077 000 170 000 155 000 154 000 040 000 166 000
>> 377 376 < \0 ? \0 x \0 m \0 l \0 \0 v \0
>
> Also UTF-16LE.
>
>
>> Ein tr -d "\0" behebt das ganze.
>
> Glück gehabt.
>
> Wenn in dem File ein Zeichen >= U+0100 vorgekommen wäre, hätte tr -d "\0"
> nichts behoben, sondern das File kaputtgemacht.
>
> Besser:
>
> Mit vi öffnen, dann
>
> :set fileencoding=utf8
>
> eingeben und abspeichern.
>
> Oder mit iconv umwandeln.
>
>> Meine Frage: was für eine Software erstellt sowas?
>
> Software, die UTF-16 verwendet. Vor allem in der Windows-Welt recht
> beliebt, kommt aber auch sonst vor.
>
> hp
>
Danke für die umfangreiche Info!
Wolf

Bernd Petrovitsch

unread,
Feb 5, 2019, 3:41:08 AM2/5/19
to
On Mon, 04 Feb 2019 18:17:44 +0100, Peter J. Holzer wrote:
> On 2019-02-04 15:47, wg <w...@gmx.net> wrote:
>> da bekomme ich grerade ein ascii file, und greppe den String 'xml', der
>> mit vi sichtbar ist.
>> Der grep findet jedoch nix.
>> Beim od -bc filename sehe ich, daß nach jedem Buchstaben eine binäre
>> null folgt:
>>
>>> od -bc file.xml | more
>> 0000000 377 376 074 000 077 000 170 000 155 000 154 000 040 000 166 000
>> 377 376 < \0 ? \0 x \0 m \0 l \0 \0 v \0
>
> Also UTF-16LE.
[...]
>> Meine Frage: was für eine Software erstellt sowas?
>
> Software, die UTF-16 verwendet. Vor allem in der Windows-Welt recht
> beliebt, kommt aber auch sonst vor.

UTF_16 ist die native Kodierung seit Win-NT - produziert z.B. von
Notepad.

Da wundert mich im Moment warum bei mir Latin1 kodierte Files aus
der Wien-Welt aufschlagen ....

MfG,
Bernd
--
Bernd Petrovitsch Email: be...@tuxoid.at
"Der Horizont vieler Menschen ist wie ein Kreis mit Radius Null.
Und das nennen sie dann ihren Standpunkt." A. Einstein
0 new messages