Prasowanie HTML

Mam dokument HTML w java.io.InputStream ;]
Jak wyciągnąć z niego wszystkie linki ;>

Zamien na string a pozniej indexOf("<a"), ("</a>"), itd.

pozdrawiam
johny

To <ort>jusz </ort>lepiej przelecieć to wyrażeniami regularnymi ;]
Ale mi chodziło o to, że słyszałem, że w J2SE jest taki pakiet do obsługi dokumentów HTML.
I myślałem że to będzie wyglądać jakoś tak:

 HTMLDocument doc=new HTMLDocument(new BufferedReader(new InputStreamReader(inputStream));
 //a następnie coś w stylu
 for(HTMLTag tag:doc.getTags("a"))System.out.println(tag.href);

Ale przeglądam tą dokumentację i nic nie widzę :(

Sebo napisał(a)

słyszałem, że w J2SE jest taki pakiet do obsługi dokumentów HTML.

Dobrze słyszałeś ;). Odpowiedź jest tu: http://4programmers.net/Forum/300602#300602

Tez mi sie zdawalo, ze ktos juz cos takiego zrobil :P

Tez mi sie przyda, dzieki [soczek]

pozdrawiam
johny

Liczba odpowiedzi na stronę

Prasowanie HTML

Sebo napisał(a)

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami