parsowanie strony (Jsoup) program nie widzi sekcji div

0

Mój program parsuje pewną stronę www:

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class MyClass {

        public static void main(String[] args) throws IOException {
                // TODO Auto-generated method stub
                String mylink = "http://www.gpwinfostrefa.pl/GPWIS2/pl/emitents/news/ŚRUBEX,PLSRBEX00014,1,current,1,1;jsessionid=H6Qd5BlVf5cMwNzDacyGJhfK.undefined";
                Document doc = Jsoup.connect(mylink).get();
            Elements sel = doc.select("div[id=kat]");      
            System.out.println(sel.size());
        }
} 
 

Dlaczego rozmiar sel wynosi 0? Powinien wynosić 1, ponieważ tyle jest sekcji div id="kat".

0

Dokumentacja twierdzi że powinno być div#kat...

0

Poprawiłem program na div#kat i wynik się nie zmienił.

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class MyClass {

	public static void main(String[] args) throws IOException {
		// TODO Auto-generated method stub
		String mylink = "http://www.gpwinfostrefa.pl/GPWIS2/pl/emitents/news/ŚRUBEX,PLSRBEX00014,1,current,1,1;jsessionid=H6Qd5BlVf5cMwNzDacyGJhfK.undefined";
		Document doc = Jsoup.connect(mylink).get();
	    //Elements sel = doc.select("div[id=kat]");
		Elements sel = doc.select("div#kat");
	    System.out.println(sel.size());
	}
}
 
0

Bo takiej sekcji na stronie nie ma. Jak pociągniesz gołe źródło wgetem jakimś to zobaczysz że tego diva w źródle nie ma. Zapewne jest dodawany dynamicznie przez javascript żeby przeszkodzić takim leecherom jak ty.

0

Sekcja może i jest, ale wysyłając zapytanie poprzez jsoup zwracany jest dokument "http://www.gpwinfostrefa.pl/GPWIS2/pl/index/" więc po stronie serwera jest jakieś zabezpieczenie przed zapytaniami z automatu ;).

1 użytkowników online, w tym zalogowanych: 0, gości: 1