Odczyt danych z <td></td> C#

0

Jak odczytać dane z pliku .html które są w formacie:

<tr>
<th>słowo</th>
<th>słowo</th>
</tr>

Bardzo bym prosił o nakierowanie.

0

Napisać prosty parser HTMLa lub skorzystać z gotowego.

0

Skorzystać z XML i XPath lub DOMDocument.

2

Skorzystać z HTML Agility Pack: http://htmlagilitypack.codeplex.com/ (.netowy odpowiednik BeautifulSoup)

Nie polecam traktowania tego jako XML (chyba że to na 100% walidujący się XHTML Strict, czyli coś co nie występuje realnie w internecie) - będzie może działać w prostych testowych przypadkach, ale nie zadziała dla żadnej prawdziwej strony.
Nie polecam pisania parsera HTML, bo 1) po co wynajdywać koło od nowa, 2) ciężko to zrobić w 100% poprawnie

1 użytkowników online, w tym zalogowanych: 0, gości: 1