Klarade millennium-buggen
|
|
Reg.datum: May 2006
Inlägg: 2 604
|
|
Klarade millennium-buggen
Reg.datum: May 2006
Inlägg: 2 604
|
Hej,
Sitter och klurar med att konvertera strängar från olika teckenkodningar till en och samma.
Har strängar som är kodade i UTF-8, ISO-8859-1 samt MacRoman.
Dessa ska konverteras till en och samma kodning, lämpligen UTF-8.
Problemet är att jag inte vet - och inte kan veta - på förhand vilken kodning strängen har. Det är alltså inte fråga om POST-data.
Miljön är php.
mb_string-funktionerna stöder inte MacRoman, och iconv saknar möjlighet att avgöra vilken kodning som jag har för handen.
Så problemet kan smalnas av till att utreda exakt vilken kodning som jag har i teckensträngen.
Alternativt kan man tänka sig en bred översättningstabell som fixar alla kodningarna på en och samma gång.
|