Visa ett inlägg
Oläst 2008-01-02, 20:06 #6
martines avatar
martine martine är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Mar 2005
Inlägg: 767
martine martine är inte uppkopplad
Mycket flitig postare
martines avatar
 
Reg.datum: Mar 2005
Inlägg: 767
Ja, om du helt vill ersätta bokstäver med prickar med motsvarande bokstav utan prickar så finns det nog ingen funktion för just detta i php… Du får nog använda mb_string-funktionerna t.ex. mb_strtolower eller preg_replace, de vanliga strängfunktionerna mäktar inte utf-8.

Tänk på att det finns många tusen tecken i utf-8 så att träffa alla är nog inte så lätt, en bra början är att utesluta och inte godkänna vissa tecken redan vid inmatningen.

Med preg_replace kan du ju göra t.ex.
$new_string = preg_replace('/[äåá]/ui',"a",$string);
men det blir ju ganska omfattande och krävande…

Om du studerar unicode-tabellerna så kan du leta upp "ranges" som minskar ner jobbet lite, t.ex. 0x0100 till 0x0105 är olika former av bokstaven a.
http://unicode.org/charts/PDF/U0100.pdf

Enklast är kanske att låta php med mb_string konvertera från uft-8 till iso-8859-1 så att de flest "osvenska" tecknen försvinner och sedan bara ha runt 250 tecken att behöva behandla…
martine är inte uppkopplad   Svara med citatSvara med citat