Parsowanie kodu html

0

Mam dosc rozlegly kod html i chcialbym z niego wyciagnac pewne rzeczy. Czytalem troche o wyrazeniach regularnych ale ponoc one nie sa zalecane do tego typu operacji. Nie wiem czy lepiej/szybciej sie posluzyc bedzie stringiem czy w jeszcze jakis inny sposob. Ma ktos jakas rade?

0

chce wiedziec w sumie jak usunac spacje i to co miedzy znakami <> dalej sobie z reszta poradze

0

Zależy co tak naprawdę chcesz zrobić. Parsowanie oznacza poznanie semantyki całego dokumentu, kontekstu, w jakim znajdują się poszczególne elementy. Tego za pomocą samych wyrażeń regularnych zrobić się nie da, ale jeżeli chodzi o wyciągnięcie jakiejś wartości w jednym znaczniku to nie ma problemu.

0

Ja znalazłem ciekawy darmowy parser kodu HtmlAgilityPack. Przejrzyj go. Ja jeszcze go nie przetestowałem więc nie wiem jak szybki jest.

0

juz zdazylem samemu zrobic funkcje ktora by to ogarniala

1 użytkowników online, w tym zalogowanych: 0, gości: 1