Czytanie tekstu z pliku HTML

0

Czy wyciągnięcie konkretnej informacji z gąszczu tekstu html mozliwe jest tylko poprzez odcinanie stringa?

N935</span>-0027/SC

Chodzi mi o wartość: N935 i 0027/SC

0

Google: wyrażenia regularne

0

możesz użyć jakiejś biblioteki do przetwarzania kodu html na drzewko DOM, potem odwoływać się łatwo poprzez na przykład xpath
większość stron w internecie nie ma w pełni poprawnego kodu więc biblioteka musi się z tym liczyć i nie wymagać idealnego kodu, a z tym ciężej trochę

nie mogę polecić niczego konkretnego do c++ bo to nie moja działka

1 użytkowników online, w tym zalogowanych: 0, gości: 1