![]() |
Nu är det så att jag behöver text informationen som ligger mellan alla <h1><h2><h3> och <td> taggar i en HTML fil. Men hjälp av dessa data skall jag senare lägga in i en databas.
Genom att använda denna kod nedan, så får jag ut ett hyfsat resultat. Men . . . . . . . . Kod:
$myFile = 'fil.html'; När jag läser in filen, så kommer inte all data med. Viss array finns inte och det är precis som ett värde har försvunnit vid läsningen av filen. Om ni tittar på koden nedan så försvinner värdet mellan den andra TD taggarna (If activated.........) Det finns en hel del blanka tecken i filen som jag inte vet riktigt vad det är. Och jag vet att HTML filen är genererad av Lotus Word Pro om det kan vara till någon hjälp? Kan det vara några udda tecken eller annan udda encodning på filen? Vet ej vilket operativsystem som används för att skapa den, men det är nog IBM relaterad. Kan man inte ta bort alla blankatecken också som ligger mellan taggarna(inte det som ligger i taggarna, utan utanför) innan man läser in det som står mellan taggarna? Är det fel i koden? Jag kan också nämna att varanna rad i html filen är helt blank. Och där det blir problem med att hitta informationen så ser koden ut så här i HTML filen. Kod:
* * *<TR> 13 Post Office Protocol (POP) authentication 14 NA - This setting is not implemented in this version of SCR 15 16 2.1.1 17 (Details) 18 19 20 2.1.1 Som ni märker så saknas det en array värde mellan 13 och 14 som skall vara "If activated........" Och på den andra stycket så saknas det också värden på 17,18 och 19. Och dessutom så saknas det en array värde mellan 17 och 18. Behöver hjälp, har stångats med detta länge nu utan att komma någonstans. MVH Patrik Uppdaterat: Jag kollade på resultatet innan jag körde preg_match_all och då finns allt med, så då måste det vara något fel på denna function. Men vad? Är det reguljära uttrycken? |
HAR LYCKATS ATT LÖSA DETTA GENOM DETTA:
preg_match_all('/\s*<td[^>]*>(.*?)<\/td>/si', $content, $out, PREG_PATTERN_ORDER); |
Hittat "caps lock"-tangenten har du också gjort tydligen ;)
|
Annars kan det vara värt att titta på xml/dom-funktionerna i php (om du inte absolut vill parsa filen själv):
http://cz2.php.net/manual/en/domdocument.l...oadhtmlfile.php |
Citat:
MVH Patrik |
Alla tider är GMT +2. Klockan är nu 20:20. |
Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson