Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Alle Dateien eines Ordners nach UTF-8 konvertieren: Werkzeug mit GUI gesucht

3,202 views
Skip to first unread message

Andreas Borutta

unread,
Dec 16, 2011, 4:15:25 AM12/16/11
to
Moin.

Kennt jemand ein unter Windows 7 64bit lauffähiges Werkzeug mit GUI
(keins für die Kommandozeile), welches in einem Rutsch alle Dokumente
eines oder mehrerer Ordner nach UTF-8 konvertieren kann?
Wichtig ist, dass kein BOM angehängt wird.

Einzelne Dokumente zu konvertieren geht problemlos in meinem Editor.

Danke.

Kommandozeilenwerkzeuge (es gibt z.B. das Werkzeug iconv) liegen mir
nicht.

Andreas

P.S.: Für den Fall, dass ein solches Werkzeug nicht existiert und
falls jemand Erfahrung mit der Installation und Anwendung von iconv
unter Windows besitzt, freue ich mich über ein Anwendungsbeispiel.

Soweit ich mich aus der Vergangenheit erinnere, war das Anwenden von
Kommandozeilentools auf alle Dateien eines Ordners oder gar auf eine
Menge ausgewählter Ordner und Dateien, stets sehr umständlich und nur
mit weiteren Skripten zu erledigen.

Thomas Braun

unread,
Dec 16, 2011, 9:36:11 AM12/16/11
to
Andreas Borutta wrote:

> Kennt jemand ein unter Windows 7 64bit lauffähiges Werkzeug mit GUI
> (keins für die Kommandozeile), welches in einem Rutsch alle Dokumente
> eines oder mehrerer Ordner nach UTF-8 konvertieren kann?

Google sagt z.B.

http://www.marblesoftware.com/Marble_Software/Charco.html

Scheint laut Aussage auf der webseite einen Batch-NModus zu haben...

Thomas

Andreas Borutta

unread,
Dec 16, 2011, 10:03:00 AM12/16/11
to
Thomas Braun schrieb:
Herzlichen Dank.

Wenn ich es richtig verstehe, muss man auch beim Batch-Prozess
zwingend ein Encoding für alle Quelldateien angeben.
Das bedeutet wohl, dass man keinen Dateien im Batchprozess
konvertieren kann, die nicht alle dasselbe Encoding aufweisen.

Und auch bevor man die Konvertierung einer einzelnen Datei startet
muss man manuell das Encoding der Quelle ermitteln und auch manuell
eintragen.

Weiterhin muss man immer bei Batchprozessen einen Zielordner angeben.
Es ist nicht möglich, Dateien an ihrem Ursprungsort zu überschreibe.

Hhmm.

A.

Thomas Feldes

unread,
Dec 16, 2011, 10:36:02 AM12/16/11
to
Am Fri, 16 Dec 2011 10:15:25 +0100 schrieb Andreas Borutta:

> Kennt jemand ein unter Windows 7 64bit lauffähiges Werkzeug mit GUI
> (keins für die Kommandozeile), welches in einem Rutsch alle Dokumente
> eines oder mehrerer Ordner nach UTF-8 konvertieren kann?

nicht getestet:
Character Set Converter 2.0 (Kommandozeile)
http://www.kalytta.com/tools.php#examples-cscvt

"This is a conversion tool to convert from one character set to another
within text documents. It supports nearly all ISO 8859 character sets, all
DOS character sets, most important Apple charactersets and most of Windows
character sets (non asian). It is also able to convert from or to UTF-8,
UTF-16 and UTF-16BE (Big Endian), UTF-32. It automatically detects UTF-8,
UTF-16, UTF-32 documents."


> Kommandozeilenwerkzeuge (es gibt z.B. das Werkzeug iconv) liegen mir
> nicht.

"You may still download and purchase my old UI based version 1.3 Trial if
you wish. However this version will not be supported any more and
development is discontinued in favor of my new version."

Thomas
--
Stuttgart liegt in Kansas!
http://stuttgart-kansas.de

Andreas Borutta

unread,
Dec 16, 2011, 10:45:21 AM12/16/11
to
Thomas Feldes schrieb:

> nicht getestet:
> Character Set Converter 2.0 (Kommandozeile)
> http://www.kalytta.com/tools.php#examples-cscvt

Danke für Deinen Vorschlag.

> "You may still download and purchase my old UI based version 1.3 Trial if
> you wish. However this version will not be supported any more and
> development is discontinued in favor of my new version."

Im UI kann man keine Ordner als Quelle angeben.

Ansonsten gilt dasselbe zur Notwendigkeit der manuellen Angabe der
Encodierung bei den Qelldateien wie bei "Charco".

Andreas

U l f Kadner

unread,
Dec 16, 2011, 3:41:26 PM12/16/11
to
Am 16.12.2011 16:45, schrieb Andreas Borutta:

> Ansonsten gilt dasselbe zur Notwendigkeit der manuellen Angabe der
> Encodierung bei den Qelldateien wie bei "Charco".

Wie willst Du das auch sonst machen? Soll das Programm für Dich raten?

Das das nur in die Hose gehen kann hat uns doch Microsoft jahrelang
gezeigt. (IE)

Du als Anwender must den Programm schon sagen welche Kodierung genutzt
wird. Alle mir bekannten offenen Heuristiken die den Ratevorgang in
einer vertretbaren Zeit erledigen haben halt auch einen ganze Menge
mögliche Fehlinterpretationen. Das kann sicher nicht Dein Ziel sein.

Wann könnte sicher eine Software schreiben die alle umzuwandelnden
Dateien komplett einliest und analysiert, aber da würde halt je nach
Dateimenge eine recht lange Lauflänge eines solchen Prozesses in der
Software resultieren.

Alternative wär vieleicht wenn Du eine Liste möglicher
Ausgangs-Kodierungen angibst. Damit könnte man den Suchvorgang auf
jedenfall schneller machen. Ob das reicht für Deinen Workflow bleibt die
Frage.

Gruß, Ulf

Helmut Richter

unread,
Dec 16, 2011, 4:15:34 PM12/16/11
to
On Fri, 16 Dec 2011, U l f Kadner wrote:

> Du als Anwender must den Programm schon sagen welche Kodierung genutzt wird.
> Alle mir bekannten offenen Heuristiken die den Ratevorgang in einer
> vertretbaren Zeit erledigen haben halt auch einen ganze Menge mögliche
> Fehlinterpretationen. Das kann sicher nicht Dein Ziel sein.

Weil bei mir nur ISO-8859-1, Windows-1252 und UTF-8 vorkommen, habe ich
mir was gebastelt, was diese drei richtig liest. Nachteil: Zeichenfolgen,
die zufällig aussehen wie UTF-8, werden auch so interpretiert, selbst wenn
sie nicht so gemeint waren (ist aber noch nie vorgekommen). Vorteile: (a)
Wenn man weiß, dass es einer der drei Codes ist, braucht mans nicht zu
spezifizieren (b) versehentliches mehrfaches Umkodieren nach UTF-8 schadet
nichts (c) das Ding wird sogar mit Dateien fertig, in die irgendein Depp
verschieden codierte Bruchstücke zusammenkopiert hat (und das ist schon
vorgekommen!).

Ist Perl (nicht für Windows geschrieben, sollte aber dort laufen), aber,
leider für den OP, ganz batchig.

--
Helmut Richter

Andreas Borutta

unread,
Dec 17, 2011, 12:08:06 PM12/17/11
to
U l f Kadner schrieb:

>> Ansonsten gilt dasselbe zur Notwendigkeit der manuellen Angabe der
>> Encodierung bei den Qelldateien wie bei "Charco".
>
> Wie willst Du das auch sonst machen? Soll das Programm für Dich raten?
>
> Das das nur in die Hose gehen kann hat uns doch Microsoft jahrelang
> gezeigt. (IE)

Bisher hat das Raten durch meinen Editor offenbar ganz gut geklappt.
Aber es waren auch keine exotischen Kodierungen dabei.

Ich habe bisher noch nie manuell eine Kodierung auswählen müssen,
bevor ich mit Erfolg den Editor nach UTF8 habe konvertieren lassen.

> Alternative wär vieleicht wenn Du eine Liste möglicher
> Ausgangs-Kodierungen angibst. Damit könnte man den Suchvorgang auf
> jedenfall schneller machen. Ob das reicht für Deinen Workflow bleibt die
> Frage.

Hauptsache ich habe wenig Huddel damit.
"Workflow" ist zu hoch gegriffen.

Wenn ich fremde Dateien für eine Überarbeitung des Markups übernommen
habe, habe ich bisher stets jede einzeln angefasst und im Editor
umgewandelt.
Wie oben schon geschrieben habe ich dazu nie die existierende
Kodierung ausgewählt.
Quellort und Zielort waren stets gleich. Ich habe also vorhandene
Dateien überschrieben. Backup gab es jeweils. Habe ich aber aufgrund
eines Umkodierfehlers nie benötigt.

Das von mir hier im Thread gesuchte Verfahren soll naturgemäß
deutliche Erleichterungen bringen.
Wenn ich weiterhin jede Datei anfassen muss um die Kodierung manuell
einzustellen und auch noch aus einem Zielort manuell zurückkopieren
muss, habe ich fast nix gewonnen.



Andreas

Peter J. Holzer

unread,
Dec 17, 2011, 1:01:28 PM12/17/11
to
On 2011-12-17 17:08, Andreas Borutta <bor...@gmx.de> wrote:
> U l f Kadner schrieb:
>
>>> Ansonsten gilt dasselbe zur Notwendigkeit der manuellen Angabe der
>>> Encodierung bei den Qelldateien wie bei "Charco".
>>
>> Wie willst Du das auch sonst machen? Soll das Programm für Dich raten?
>>
>> Das das nur in die Hose gehen kann hat uns doch Microsoft jahrelang
>> gezeigt. (IE)
>
> Bisher hat das Raten durch meinen Editor offenbar ganz gut geklappt.

Zwischen welchen Kodierungen musste der Editor denn da entscheiden? Und
hätte es einen Unterschied gemacht, wenn er falsch geraten hätte?

> Aber es waren auch keine exotischen Kodierungen dabei.

Die "exotischen Kodierungen" sind oft noch leichter zu erkennen.
Schwieriger ist das bei sehr ähnlichen Kodierungen, wie z.B. den
Latin-Varianten von ISO-8859. Unterscheide mal zuverlässig, ob ein File
ISO-8859-1 oder ISO-8859-2 ist. Natürlich gibt es dafür Heuristiken: Ein
"ź" kann in der Mitte eines Worts vorkommen, ein "¼" eher nicht - wenn
also 0xBC in einem Wort vorkommt, ist es eher ISO-8859-2. Usw. Aber die
meisten Editoren werden das eher nicht machen.

hp


--
_ | Peter J. Holzer | Deprecating human carelessness and
|_|_) | Sysadmin WSR | ignorance has no successful track record.
| | | h...@hjp.at |
__/ | http://www.hjp.at/ | -- Bill Code on as...@irtf.org

Andreas Borutta

unread,
Dec 17, 2011, 1:10:08 PM12/17/11
to
Peter J. Holzer schrieb:

>>>> Ansonsten gilt dasselbe zur Notwendigkeit der manuellen Angabe der
>>>> Encodierung bei den Qelldateien wie bei "Charco".
>>>
>>> Wie willst Du das auch sonst machen? Soll das Programm für Dich raten?
>>>
>>> Das das nur in die Hose gehen kann hat uns doch Microsoft jahrelang
>>> gezeigt. (IE)
>>
>> Bisher hat das Raten durch meinen Editor offenbar ganz gut geklappt.
>
> Zwischen welchen Kodierungen musste der Editor denn da entscheiden? Und
> hätte es einen Unterschied gemacht, wenn er falsch geraten hätte?

Ich habe mich darum bisher nie gekümmert, da es keinen Anlass gab.
Ansonsten hätte ich gerne Auskunft gegeben.

Andreas

georg.n...@gmail.com

unread,
Jan 16, 2014, 3:22:17 AM1/16/14
to
Auch wenn es schon etwas her ist...

http://www.rotatingscrew.com/utfcast-express.aspx

und der Artikel, der mich darauf aufmerksam gemacht hat:
http://www.addictivetips.com/windows-tips/how-to-batch-convert-text-files-to-utf-8-encoding/

Georg

leonidas....@gmail.com

unread,
Jul 18, 2014, 8:20:54 AM7/18/14
to
Das war genau das was ich gebraucht habe weil meine PHP-Dateien sich im Brackets-Editor nicht öffnen ließen. Danke!!!!

Ralf

unread,
Oct 15, 2020, 6:32:48 AM10/15/20
to
Hi,

es geht mit dem kostenlosen Programm PSPad. Das hat automatischer Erkennung und Batch-Konvertierung, alles in schöner Benutzeroberfläche und ist auch kostenlos.

Viel Spaß!
0 new messages