Parsowanie strony jsp PHP Simple HTML DOM Parser

0

Cześć, chcę sparsować stronę:
http://mpk.lodz.pl/rozklady/utrudnienia.jsp
z tego co wiem strona posiada 2 wersje językowe, polską i angielską. Ja chcę sparsować polską, ale przy próbie parsowania PHP Simple HTML DOM Parser pobiera wersję angielską, jak pobrać wersję polską?Mój kod:

  <?
// Include the library
include('simple_html_dom.php');
// Retrieve the DOM from a given URL
$html = file_get_html('http://mpk.lodz.pl/rozklady/utrudnienia.jsp');
echo $html;
}   
?>

echo wyświetla stronę angielską.

1

Widzisz - możliwe że to ładowanie via html ustawia takie headery że strona mpk myśli że język który jest żądany to angielski? Spróbuj normalnie pobrać stronę curlem ustawiając headery imitujące Twoją przeglądarkę a potem tylko:

$str = curl_exec($curl);
curl_close($curl);

$html_base = new simple_html_dom();
$html_base->load($str);

I powinno śmigać.

0

W jaki sposób można zaimitować przeglądarkę?

0

Ok już wiem:

 

$ch = curl_init('http://mpk.lodz.pl/rozklady/utrudnienia.jsp');
$headers = array('Accept-Language: pl',
'Accept-Charset: ISO-8859-2,utf-8;q=0.7,*;q=0.7');
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$str = curl_exec($ch);
curl_close($ch);

$html_base = new simple_html_dom();
$html_base->load($str);

1 użytkowników online, w tym zalogowanych: 0, gości: 1