Schnäppchen

Kategorien

ISO-8859 in UTF-8 wandeln

Ich hasse dieses Chaos, dass immer noch zwischen den verschiedenen Text-Formaten herrscht…

Mal gucken, was man mit einem simplen Editor standardmäßig für Dateien erstellt. Hier das Ergebnis, dass das Linux Kommando file für unterschiedliche Textdateien ausgibt:

  • Simpler Text mit dem Windows 2000 Notebook erstellt:
    -> ASCII text, with CRLF line terminators
  • Simpler Text mit Umlauten mit dem Windows 2000 Notebook erstellt:
    -> ISO-8859 text, with CRLF line terminators
  • Simpler Text mit dem Windows 2000 Notebook erstellt und als UTF8 gespeichert:
    -> UTF-8 Unicode (with BOM) text, with CRLF line terminators
  • Simpler Text mit dem GNU-Emacs unter Debian Lenny erstellt:
    ASCII text
  • Simpler Text mit Umlauten mit dem GNU-Emacs unter Debian Lenny erstellt:
    -> UTF-8 Unicode text
  • dito übrigens auch mit dem GNU-Emacs unter Suse 11.3

OK, den Unterschied zwischen ASCII und ISO-8859 kann ich aus technischer Sicht vernachlässigen, aber der Rest nervt trotzdem!

Bisher habe ich Textdateien tatsächlich in irgendeinen Editor geladen und wieder gespeichert, wenn ich den Typ ändern wollte. Das ist nun vorbei, denn eher zufällig habe ich mich eben an ein uraltes Linux-Kommando erinnert – iconv.

iconv –from-code=ISO-8859-1 –to-code=UTF-8 ./data.sql > ./newdata.sql

Hinterlassen Sie eine Antwort

 

 

 

Sie können diese HTML Tags verwenden

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

eMail-Benachrichtigung bei weiteren Kommentaren.
Auch möglich: Abo ohne Kommentar.