Jetzt auch in UTF-8

Wie man neulich bei bueltge lesen konnte, sollte man für die kommenden WordPress-Versionen seine Datenbank auf Unicode (d.h. UTF-8) umstellen[1]. Dafür gibt es das Plugin UTF-8 Database Converter.

Ich habe das am Wochenende durchgeführt und gebe hier noch ein paar Tipps, für diejenigen, die es mir gleichtun möchten.

  1. Angefangen wird natürlich mit einem Datenbank-Backup. Alles andere wäre grobe Fahrlässigkeit. In diesem Zusammenhang empfehle ich die Plugins WordPress Database Backup und WP-DB-Manager
  2. Das Plugin wurde eigentlich für WP-Version 2.2 geschrieben. Wer wie ich die aktuelle Version 2.3.2 verwendet, wird deshalb nach Aufruf der Plugin-Seite im Admin-Bereich mit folgender Meldung begrüßt:

WARNING
VERSION NOT SUPPORTED

This plugin has been developed and successfully tested under WordPress 2.2.x and 2.1.x
We cannot assure that it will work in any other minor or major release.
If you still want to use it after this warning proceed with the next and final step.

Also this warning may show if you change the version value „wp_version“ inside the file „/wp-includes/version.php“, so if you have changed this value and you know that you have supported version of WordPress… Ignore this warning and continue to the next and final step.

Diese und die nächste Warnung kann man ignorieren, denn es sollte auch mit der aktuellen WordPress-Version funktionieren. Hat es zumindest bei mir. Für den Negativfall gibt es das Backup.

  1. Nach der Konvertierung in Unicode werden die in der Datenbank stehenden kryptischen Zeichen im Blog in die richtigen Umlaute und Sonderzeichen umgewandelt. Wenn allerdings in der Datei wp-config.php die Zeile

    define('DB_CHARSET', 'utf8');

    steht (was empfehlenswert ist), dann werden die kryptischen Zeichen so wie sie sind im Blog dargestellt. Deshalb müssen diese durch die richtigen Zeichen ersetzt werden, was relativ schnell mit Suchen und Ersetzen geschieht[2].

Jetzt kann WP 2.5 kommen. Dauert zwar noch genau zwei Monate, aber besser früh als gar nicht (oder so ähnlich). Ein besonders schöner Nebeneffekt der Konvertierung ist übrigens, dass jetzt endlich auch bei der Anzeige der letzten Kommentare Umlaute und Sonderzeichen funktionieren:

Kommentare mit Sonderzeichen

  1. Insofern ist dieser Beitrag nur für Blogger interessant, die mit WordPress bloggen und dies auf eigenen Webspace tun. []
  2. Wenn ich einige übersehen habe, bitte ich um Rückmeldung. []

Veröffentlicht von

juliaL49

Wilde Mischung aus musikinteressiertem Konzertbesucher, fernsehbegeistertem Whovian, radfahrendem Läufer, fotografierendem Atheisten und ausgewandertem Bioinformatiker

8 Gedanken zu „Jetzt auch in UTF-8“

  1. Hm, ich sehe in der Sidebar aber ausgerechnet bei meinem Kommentar weder den „ndash“ korrekt noch „müsste“ – die anderen, die du markiert hast, stimmen aber auch hier. (Übrigens sowohl in Firefox als auch im IE7.)

    Wenn ich den Kommentar dann aufrufe, stimmt das „müsste“ (in der Sidebar abgeschnitten?), aber der Strich immer noch nicht. In Daves Kommentar darunter stimmt am Ende was nicht, was vermutlich drei Punkte sein sollen…

  2. waha! vorher funktionierte es noch 😥 Menno, jetzt darf ich das Suchen+Ersetzen nochmal machen oder wie!?! :motz:

    Nachtrag: Grr, ich hab jetzt die Bindestriche und Punkte ersetzt (query erfolgreich) und doch erscheinen die Zeichen noch im Kommentar! Wenn ich den Query erneut ausführe, sind “0 rows affected”. 😕

  3. 😳 Wenn man die Kommentare ändern will, was stimmt bei dieser Abfrage nicht:
    UPDATE wp_posts SET post_content = REPLACE (
    post_content,
    '–',
    '-');

  4. Arghh, diese ewigen Updates gehen mir gehörig auf die Nerven. Vor allem, weil einem nie jemand sagen kann, ob das wirklich alles nötig ist. :/

  5. richtig, Andreas, das war auch mehr rhetorisch gemeint xD (die Ellipsen und ndashes sollten jetzt richtig auftauchen)

    Chlorine, Updates hin oder her. Hauptsache die Sicherheitslücken werden gestopft! Und hier das wollte ich schon länger machen, bin ja ganz verrückt nach Standards :mrgreen:

  6. Warte mal ab, mit wie vielen Bugs 2.5 daherkommen wird 😉
    UTF8 nutze ich schon seit langem, verbunden mit einem Umlaut-Konverter Plugin.

Kommentare sind geschlossen.