Kom ihåg mig?
Home Menu

Menu


Har ett litet problem med tecken

 
Ämnesverktyg Visningsalternativ
Oläst 2006-11-05, 15:21 #1
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Bygger ett program som underlättar att spara ner artiklar från en artikelsajt. När den sparat ner html så får jag konstiga tecken och vet inte riktigt hur detta ska konverteras. Jag misstänker att det är något unicode problem. Programmet är skrivet i c-sharp.
Konstiga tecken exempel är detta ’
Har provat bytt från
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
till
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">

Vet inte riktigt hur jag ska lösa detta. Letar desperat efter något bibliotek i dotnet som kanske kan lösa det.
MVH Andla
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-05, 16:26 #2
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Felet verkar vara när jag laddar upp med ftp.

Provar att byta till FTPFileTransferType.ACII
Körde binärt innan.
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-05, 16:51 #3
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Nope problemet kvarstår.

När jag sparade sidan lokalt manuellt så blev det rätt tecken. Se här:

Det är detta som blir ’

Jag har alltså ingen chans att söka på google för att den ignorera dessa tecken.

Ultraedit frågar om jag vill konvertera det nedladdade documentet till dosformat.
Om jag konverterar så blir tecknen bra. Om jag inte gör det så syns tecknen som
OCÖ fast O har en ^ ovanför och C har en svans ner och Ö är inget vanligt Ö.
Kör jag copy och paste så blir det dessa tecken.
’

Ska prova leka lite med System.Text.Encoding se om jag kan göra något.

Tacksam för lite tips om du vet några.
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-05, 22:25 #4
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Nu tror jag inte längre att det är ett problem i mitt program utan i html koden.
Jag tog bort den här raden:
<META http-equiv=Content-Type content="text/html; charset=windows-1252">
och fick det att fungera med tecken.
Fast på en annan webbsida med koden:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
så fungerar tecken men när jag lägger in den raden på min htmlsida får jag konstiga tecken.


sparar jag htmlkoden på den sidan som fungerar. Alltså www.ezinearticles.com och skickar upp till min webbsida så blir det konstiga tecken.

Detta börjar bli riktigt jvla jobbigt....
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-05, 22:57 #5
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Har gjort massa fel genom att jag slarvade med att ha inte ha litet 'i' på index.php. Tur att jag testade med att lägga in ett dummy ord.

Nu tror jag att jag har löst det. Om man sparar filen som ansi från notepad och laddar upp den så blir det rätt tecken. Däremot om man sparar filen som utf8 så blir det konstiga tecken.

Nu återstår bara att försöka rätta till detta programmatiskt.
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-07, 10:08 #6
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Pappa har löst programmeringen.
andla är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-07, 10:36 #7
rocky rocky är inte uppkopplad
Mycket flitig postare
 
Reg.datum: May 2006
Inlägg: 824
rocky rocky är inte uppkopplad
Mycket flitig postare
 
Reg.datum: May 2006
Inlägg: 824
Skönt att det löste sig, det är bra att du skriver lösningar.

I framtiden kanske någon som har samma problem använder sökfunktionen och hittar din tråd.
rocky är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-07, 11:04 #8
najks avatar
najk najk är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Oct 2005
Inlägg: 1 224
najk najk är inte uppkopplad
Har WN som tidsfördriv
najks avatar
 
Reg.datum: Oct 2005
Inlägg: 1 224
6 inlägg varav 5 av trådskaparen själv. Trots det är nästan alla inlägg ändrade, vad är detta för typ av spam?
najk är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-07, 11:41 #9
ChristofferJs avatar
ChristofferJ ChristofferJ är inte uppkopplad
Medlem
 
Reg.datum: Feb 2005
Inlägg: 209
ChristofferJ ChristofferJ är inte uppkopplad
Medlem
ChristofferJs avatar
 
Reg.datum: Feb 2005
Inlägg: 209
Spam? Det är väll mest ett desperat försök att få hjälp, men med lite hjärta (då ingen annan verkar velat eller kunnat svara) delat med sig av det han kommit fram till själv. Andla är nog ytterst tacksam för din synpunkt på saken .. hjälper säkerligen avsevärt.
ChristofferJ är inte uppkopplad   Svara med citatSvara med citat
Oläst 2006-11-07, 12:37 #10
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
andla andla är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 723
Mina tankar var blandade när jag skrev inlägg efter inlägg.
Tanke nr1:
Vad andra tycker: Vet han inte detta. De är ju de mest grunläggande sakerna. Det får han lösa själv.

Tanke nr2:
Kanske är det som så att folk inte kan detta så bra.

Kul att det kom lite kommentarer på slutet. Det är alltid uppskattat

Programmeringslösningen:

StreamWriter sr = new StreamWriter("MyFile.txt",
Encoding.GetEncoding("iso-8859-x"));

Raden ovan löste problemet. x fick jag ändra till 1. Jag har också lagt till en funktion som automatiskt tar reda på vilken encoding en viss htmlsida har och ställer in detta när man skickar till ftpfunktionen.
Alltså parsa sidan och ta fram allt mellan 'charset=' och '">'
Allt detta i denna tag:
<META http-equiv=Content-Type content="text/html; charset=windows-1252">

Jag antar de ftp-program ni använder kanske gör en sådan parsning automatiskt.


Allmän information:
Om ni får konstiga tecken, prova då att spara mellan ansi, unicode, UTF8 osv från notepad eller andra textredigeringsprogram och testa ladda upp var för sig.
andla är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 20:44.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017