 |
Mycket flitig postare
|
|
Reg.datum: Mar 2005
Inlägg: 767
|
|
Mycket flitig postare
Reg.datum: Mar 2005
Inlägg: 767
|
Optimalt är förstås om du hittar ett tecken som alltid är med i EXIF-filen men har ett annat nummer i MacRoman och ISO. Annars är det väl värt att leta efter förekomsten av 0xe4, 0xe5 och 0xf6 (iso) eller 0x8a, 0x8c och 0x9a (macroman) i strängarna (koderna för åäö)
/[a-z]+[\xe4\xe5\xf6][a-z]+/ för iso
/[a-z]+[\x8a\x8c\x9a][a-z]+/ för macroman
med preg_match exempelvis
Accenttecknen ligger tydligen generellt högre (i bit-ordning) i iso än i macroman - även av detta skulle man kunna göra något.
Edit: entydigt kan du aldrig veta eftersom du aldrig kan veta om man inte kan veta om någon menat att skriva "f^r" eller "för" - bitarna är exakt desamma - man får gå på sannolikhet.
|