Jsoup ustawienie ENCODING to UTF-8

Odpowiedz Nowy wątek
2019-03-12 21:12
0

Chcę pobierać zawartość internetów w formacie UTF-8 w taki sposób:

String url = "https://4programmers.net/Forum/Java/323982-jsoup_ustawienie_encoding_to_utf_8?p=1575353#id1575353"
String browser = "Mozilla/5.0"
Document doc = Jsoup.connect(url).userAgent(browser).get();

a potem doc.select("blablabla").attr("id").toString() itd.

JAk ustawić encoding na samym początku? W dokumentacji widzę taką możliwość tylko przy Jsoup.parse() czyli jak rozumiem musiałbym pobierać zawartość neta jakimś scanerem i potem jako tekst zapododawać do Jsoup.parse() ale tak nie chcę...

edytowany 2x, ostatnio: Julian_, 2019-03-12 21:15

Pozostało 580 znaków

2019-03-12 21:31
0
Julian_ napisał(a):

Chcę pobierać zawartość internetów w formacie UTF-8 w taki sposób:

String url = "https://4programmers.net/Forum/Java/323982-jsoup_ustawienie_encoding_to_utf_8?p=1575353#id1575353"
String browser = "Mozilla/5.0"
Document doc = Jsoup.connect(url).userAgent(browser).get();

a potem doc.select("blablabla").attr("id").toString() itd.

JAk ustawić encoding na samym początku? W dokumentacji widzę taką możliwość tylko przy Jsoup.parse() czyli jak rozumiem musiałbym pobierać zawartość neta jakimś scanerem i potem jako tekst zapododawać do Jsoup.parse() ale tak nie chcę...


użyłem tego:


    Document getUrlDoc(String url) {
        Connection connect = Jsoup.connect(url);
        connect.request().followRedirects(false);
        URI u = null;
        try {
            u = new URI(url);
        } catch (URISyntaxException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        Document doc = null;
        try {
            doc = connect.url(new URI(u.getScheme(), u.getUserInfo(), u.getHost(), u.getPort(),
                    URLDecoder.decode(u.getPath(), "UTF-8"), u.getQuery(), u.getFragment()).toURL()).get();
        } catch (IOException | URISyntaxException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        if (connect.response().statusCode() == 301 && connect.response().header("Location") != null) {
            return getUrlDoc(connect.response().header("Location"));
        }
        return doc;
    }

masakra jakaś.

edytowany 1x, ostatnio: Julian_, 2019-03-12 21:31

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0