FAQ |
Kalender |
![]() |
#1 | ||
|
|||
Klarade millennium-buggen
|
Som rubriken säger, vissa kolumner och tabeller i databasen har hamnat i en enda röra rent teckenkodningsmässigt.
Jag vet att man aldrig ska hamna i den situationen, men jag sitter där och vet inte hur jag ska lyckas. Saken är den att det genom tiderna har blandats teckenkodningar lite ostrukturerat, en kolumn här med UTF8, en där med latin1 (iso-8859-1 för att vara exakt). Hur gör jag nu för att få allt till utf-8 så det blir ordning och reda? Att konvertera själva databaserna har jag inte hittat rätt i, försöker istället konvertera en dump av databasen. Iconv slår bakut och slutar med error när den stöter på tecken som inte ska finnas där, annars vore det smidigast. Finns det något funktion eller script som kan tugga igenom en textfil och konvertera det giltiga utf8-kombinationerna som den hittar utan att bry sig om andra tecken som den stöter på? Eller tvärtom, konvertera lösa åäöÅÄÖüÜéÉ till utf8 utan att hetsa upp sig över att det redan finns utf-8 tecken i filen? Lite fel får det bli, det kan man alltid fixa, bara jag slipper göra sök och byt. |
||
![]() |
![]() |
|
|