FAQ |
Kalender |
![]() |
#1 | ||
|
|||
Mycket flitig postare
|
Bygger ett program som underlättar att spara ner artiklar från en artikelsajt. När den sparat ner html så får jag konstiga tecken och vet inte riktigt hur detta ska konverteras. Jag misstänker att det är något unicode problem. Programmet är skrivet i c-sharp.
Konstiga tecken exempel är detta ’ Har provat bytt från <meta http-equiv=Content-Type content="text/html; charset=windows-1252"> till <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"> Vet inte riktigt hur jag ska lösa detta. Letar desperat efter något bibliotek i dotnet som kanske kan lösa det. MVH Andla |
||
![]() |
![]() |
![]() |
#2 | ||
|
|||
Mycket flitig postare
|
Felet verkar vara när jag laddar upp med ftp.
Provar att byta till FTPFileTransferType.ACII Körde binärt innan. |
||
![]() |
![]() |
![]() |
#3 | ||
|
|||
Mycket flitig postare
|
Nope problemet kvarstår.
När jag sparade sidan lokalt manuellt så blev det rätt tecken. Se här: ’ Det är detta som blir ’ Jag har alltså ingen chans att söka på google för att den ignorera dessa tecken. Ultraedit frågar om jag vill konvertera det nedladdade documentet till dosformat. Om jag konverterar så blir tecknen bra. Om jag inte gör det så syns tecknen som OCÖ fast O har en ^ ovanför och C har en svans ner och Ö är inget vanligt Ö. Kör jag copy och paste så blir det dessa tecken. ’ Ska prova leka lite med System.Text.Encoding se om jag kan göra något. Tacksam för lite tips om du vet några. |
||
![]() |
![]() |
![]() |
#4 | ||
|
|||
Mycket flitig postare
|
Nu tror jag inte längre att det är ett problem i mitt program utan i html koden.
Jag tog bort den här raden: <META http-equiv=Content-Type content="text/html; charset=windows-1252"> och fick det att fungera med tecken. Fast på en annan webbsida med koden: <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"> så fungerar tecken men när jag lägger in den raden på min htmlsida får jag konstiga tecken. sparar jag htmlkoden på den sidan som fungerar. Alltså www.ezinearticles.com och skickar upp till min webbsida så blir det konstiga tecken. Detta börjar bli riktigt jvla jobbigt.... |
||
![]() |
![]() |
![]() |
#5 | ||
|
|||
Mycket flitig postare
|
Har gjort massa fel genom att jag slarvade med att ha inte ha litet 'i' på index.php. Tur att jag testade med att lägga in ett dummy ord.
Nu tror jag att jag har löst det. Om man sparar filen som ansi från notepad och laddar upp den så blir det rätt tecken. Däremot om man sparar filen som utf8 så blir det konstiga tecken. Nu återstår bara att försöka rätta till detta programmatiskt. |
||
![]() |
![]() |
![]() |
#6 | ||
|
|||
Mycket flitig postare
|
Pappa har löst programmeringen.
![]() |
||
![]() |
![]() |
![]() |
#7 | ||
|
|||
Mycket flitig postare
|
Skönt att det löste sig, det är bra att du skriver lösningar.
I framtiden kanske någon som har samma problem använder sökfunktionen och hittar din tråd. |
||
![]() |
![]() |
![]() |
#8 | |||
|
||||
Har WN som tidsfördriv
|
6 inlägg varav 5 av trådskaparen själv. Trots det är nästan alla inlägg ändrade, vad är detta för typ av spam?
|
|||
![]() |
![]() |
![]() |
#9 | |||
|
||||
Medlem
|
Spam? Det är väll mest ett desperat försök att få hjälp, men med lite hjärta (då ingen annan verkar velat eller kunnat svara) delat med sig av det han kommit fram till själv. Andla är nog ytterst tacksam för din synpunkt på saken .. hjälper säkerligen avsevärt.
|
|||
![]() |
![]() |
![]() |
#10 | ||
|
|||
Mycket flitig postare
|
Mina tankar var blandade när jag skrev inlägg efter inlägg.
Tanke nr1: Vad andra tycker: Vet han inte detta. De är ju de mest grunläggande sakerna. Det får han lösa själv. Tanke nr2: Kanske är det som så att folk inte kan detta så bra. Kul att det kom lite kommentarer på slutet. Det är alltid uppskattat ![]() Programmeringslösningen: StreamWriter sr = new StreamWriter("MyFile.txt", Encoding.GetEncoding("iso-8859-x")); Raden ovan löste problemet. x fick jag ändra till 1. Jag har också lagt till en funktion som automatiskt tar reda på vilken encoding en viss htmlsida har och ställer in detta när man skickar till ftpfunktionen. Alltså parsa sidan och ta fram allt mellan 'charset=' och '">' Allt detta i denna tag: <META http-equiv=Content-Type content="text/html; charset=windows-1252"> Jag antar de ftp-program ni använder kanske gör en sådan parsning automatiskt. Allmän information: Om ni får konstiga tecken, prova då att spara mellan ansi, unicode, UTF8 osv från notepad eller andra textredigeringsprogram och testa ladda upp var för sig. |
||
![]() |
![]() |
Svara |
|
|