Jump to content
InvisionCommunity.de - Der Deutsche Invision Community Support
mthies

Umlautproblem nach Import

Recommended Posts

Ich habe mein altes phpBB Board importiert. Leider werden die Umlaute nicht dargestellt. In der Datenbank sind sie aber richtig vorhanden.

Soweit ich mich in das Problem reingelesen habe, liegt dies an an dem Zeichencode. Dort steht in der Datenbank "latin1_swedish_ci " es sollte utf-8 sein, oder?

Wie bekomme ich den Zeichensatz geändert?

Share this post


Link to post

War das phpBB denn UTF-8?

Ich vermute du wirst um eine Konvertierung nicht herumkommen -> http://community.invisionpower.com/files/file/2929-character-set-converter/

Share this post


Link to post

Da ich der Materie nicht mächtig bin und mit meinem Schulenglisch Probleme habe, meine Unkenntnis in die richtigen Worte zu kleiden, stelle ich die Frage zu dem convertCharset.php hier nochmal.

Die convertCharset.php schneidet alles ab, sobald ein Umlaut kommt. Statt "alles drüber" bleibt noch "alles dr" - der Rest ist weg. Schreibt man den Ursprungszeichensatz denn irgendwo hinein oder woran könnte das Problem liegen?

Share this post


Link to post

Die Anleitung für den gebrauch der convertCharset.php ist in der Datei selbst enthalten.

Sollte man sich in Ruhe 2-3 Mal durchlesen und das ganze dann in Ruhe angehen.

(ich rate sowieso JEDEM bei einer migration den Service von IPS zu nutzen, da sind die $60 nämlich prima angelegt)

Share this post


Link to post

(ich rate sowieso JEDEM bei einer migration den Service von IPS zu nutzen, da sind die $60 nämlich prima angelegt)

da steigen die Gebühren gerne mal um 100%..

Share this post


Link to post

Hallo,

ich habe vor kurzem selber ein Importscript gebaut, um aus einem alten CMS und einem Untermodul die Daten in das neue IP-Content System zu importieren. Habe dafür eine neue Datenbank angelegt, etc. Hat auch alles super funktioniert.

Einzige was mir Grübeln bereitet: Bestimmte Sonderzeichen werden nicht korrekt angezeigt. Umlaute funktionieren, andere Sachen wiederum nicht. Kann mir aber auch nicht erklären, woran das liegt. Beide Datanbanken sind utf8_general codiert. Ich habe die Textabschnitte aus der alten Datenbank mittels PHP vor dem Eintrag in die neue Datenbank mit folgendem Code bearbeitet:

addslashes ( utf8_encode ( strip_tags ( $variable ) ) );

Hat jemand eine pauschale Lösung?

Beispiel:

Das Physikum Kompendium zum 1. Abschnitt der Ärztlichen Prüfung

Edited by Fabian Sperb

Share this post


Link to post

Ein ähnliches Problem hatte ich damals bei der Konvertierung auch - sofern ich mich erinnere, waren davon ausschließlich die "Trennstriche" betroffen (also nicht das normale Minus). Diese speziellen Zeichen konnte der Server wohl nicht verarbeiten - jedenfalls war/ist das meine Erinnerung. Ich müsste später noch einmal nachschauen und mir die Erklärung raussuchen.

Share this post


Link to post

Ein ähnliches Problem hatte ich damals bei der Konvertierung auch - sofern ich mich erinnere, waren davon ausschließlich die "Trennstriche" betroffen (also nicht das normale Minus). Diese speziellen Zeichen konnte der Server wohl nicht verarbeiten - jedenfalls war/ist das meine Erinnerung. Ich müsste später noch einmal nachschauen und mir die Erklärung raussuchen.

Ja, ist. u.a. der Trennstrich, aber auch das €-Zeichen macht Probleme.

Gibts irgendwie möglicherweise schon eine vorgefertigte RegEx-Funktion, um die spezifischen Sonderzeichen zu ersetzen?

Das Problem ist ja einfach, dass man zwar generell die Sonderzeichen html-conform ersetzen kann (zb.: & in &), dass dabei aber auch die HTML-Codes verloren gehen, da die Tags ja auch entsprechend umgewandelt werden.

Share this post


Link to post

Wenn ich mich recht erinnere habe ich die Datenbank damals exportiert und die .sql-Datei in einem Texteditor per "Suchen & Ersetzen" bearbeitet (du kannst die merkwürdigen Karros einfach kopieren und dann suchen/ersetzen - vorausgesetzt natürlich du weißt, welches Sonderzeichen sich dahinter verbirgt).

HIER hatte ich anfang 2010 die problematischen Sonderzeichen beim konvertieren angesprochen, ggf. hilft dir das dort diskuttierte ja weiter.

Share this post


Link to post

Wenn ich mich recht erinnere habe ich die Datenbank damals exportiert und die .sql-Datei in einem Texteditor per "Suchen & Ersetzen" bearbeitet (du kannst die merkwürdigen Karros einfach kopieren und dann suchen/ersetzen - vorausgesetzt natürlich du weißt, welches Sonderzeichen sich dahinter verbirgt).

HIER hatte ich anfang 2010 die problematischen Sonderzeichen beim konvertieren angesprochen, ggf. hilft dir das dort diskuttierte ja weiter.

Keine andere Idee? Das sind immerhin 380 Rezensionen, welche jede ca. 2 A4-Seiten Text umfasst. Da wird man doch nie fertig...

Share this post


Link to post

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


×