Odczyt danych z <td></td> C#

Odpowiedz Nowy wątek
2015-02-08 09:43
Pijany Krawiec
0

Jak odczytać dane z pliku .html które są w formacie:

<tr>
<th>słowo</th>
<th>słowo</th>
</tr>

Bardzo bym prosił o nakierowanie.

Pozostało 580 znaków

2015-02-08 10:14
0

Napisać prosty parser HTMLa lub skorzystać z gotowego.


Pozostało 580 znaków

2015-02-08 11:00
0

Skorzystać z XML i XPath lub DOMDocument.

Pozostało 580 znaków

2015-02-08 22:14
msm
1

Skorzystać z HTML Agility Pack: http://htmlagilitypack.codeplex.com/ (.netowy odpowiednik BeautifulSoup)

Nie polecam traktowania tego jako XML (chyba że to na 100% walidujący się XHTML Strict, czyli coś co nie występuje realnie w internecie) - będzie może działać w prostych testowych przypadkach, ale nie zadziała dla żadnej prawdziwej strony.
Nie polecam pisania parsera HTML, bo 1) po co wynajdywać koło od nowa, 2) ciężko to zrobić w 100% poprawnie

edytowany 1x, ostatnio: msm, 2015-02-08 22:15

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0