tablica.pl parsowanie curlem

0

Witam, chce pobrac curlem telefon z oferty tablica.pl (normalnie to ajax/json) , niby mam adres proboje odtworzyc naglowki ale zwraca mi komunikat ze przekroczylem limity. cos pewnie robie nie tegas. moze jakas podpowiedź wasza?

np ogłoszenie :
http://tablica.pl/oferta/dom-gospodarstwo-w-zalinie-CID3-ID3ekrr.html
zapytanie ajaxowe
http://tablica.pl/ajax/misc/contact/phone/3ekrr/

i w odpowiedzi dostaje : "{"error":1,"value":"Limit zosta\u0142 przekroczony. Spr\u00f3buj ponownie za godzin\u0119."}"

a jak dodam w naglowku gzip, to otrzymuje krzaki :
��K@0ЫLf-��p;[���>�f(1��ؾ��h���Tz K��jw�v݄D�)x33uB��y2dm�����Y�a�^���*b|^�5�v\

 $ch = curl_init();
        $headers=array(
            "Host: tablica.pl",
            "Connection: keep-alive",
            "X-Requested-With: XMLHttpRequest",
            "Accept-Encoding: gzip,deflate,sdch",
            "Cookie: xtvrn=$507462$; cookieBarSeen=true; last_locations=1079-0-0-Bia%C5%82ystok-podlaskie; PHPSESSID=9oph1cp11fnk1951i8cvag4cs2; __utma=180017569.1513611367.1395743951.1395815719.1395818355.6; __utmb=180017569.3.8.1395818429927; __utmc=180017569; __utmz=180017569.1395815719.5.3.utmcsr=tablica.yum.pl|utmccn=(referral)|utmcmd=referral|utmcct=/index.php",
            "Accept: application/json",
            ""
        );
    $agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5"; 
curl_setopt($ch, CURLOPT_HTTPHEADER, 
        array(
            'Accept-Encoding:gzip', 
            'Content-Type: application/x-json; charset=utf-8',
            'Connection: Keep-Alive',
            'Accept: */*',
            'Host: tablica.pl',
            'X-Requested-With: XMLHttpRequest',
            ''
            )
        ); 
curl_setopt($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt($ch,CURLOPT_COOKIEJAR,"cookie.txt");
#curl_setopt($ch, CURLOPT_ENCODING ,"GZIP");
curl_setopt($ch,CURLOPT_USERAGENT,$agent);
curl_setopt($ch,CURLOPT_HEADER, false);
curl_setopt($ch,CURLOPT_NOBODY ,false);
curl_setopt($ch,CURLOPT_RETURNTRANSFER ,true);
curl_setopt($ch, CURLOPT_REFERER, $referer);
curl_setopt($ch, CURLOPT_URL, $url);
      echo   $e=curl_exec($ch);
 
0

ja dostaję

{"value":"600 231 877"}

zapewne testując naładowałeś tysiące requestów i dostałeś bana.
daj sobie spokój na godzinę i powinno za godzinę działać.

0

to nie to, klikając w ogłoszeniu w Pokaż (ajaxem pobierany jest telefon/javascript) i działa tyle razy ile chcę, no ale jak "niby" robie to curlem to juz mam error. podejrzewam ze źle to wykonuje curlem, albo nie uwzgledniam jakis zabezpieczen...

1
$url = "http://tablica.pl/ajax/misc/contact/phone/3ekrr/";
$ch = curl_init();
curl_setopt($ch, CURLOPT_HTTPHEADER,
    array(
        'User-Agent: Opera/9.80 (Windows NT 6.1; WOW64) Presto/2.12.388 Version/12.16'
    )
);
curl_setopt($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt($ch,CURLOPT_COOKIEJAR,"cookie.txt");
curl_setopt($ch,CURLOPT_HEADER, false);
curl_setopt($ch,CURLOPT_NOBODY ,false);
curl_setopt($ch,CURLOPT_RETURNTRANSFER ,true);
curl_setopt($ch, CURLOPT_REFERER, $referer);
curl_setopt($ch, CURLOPT_URL, $url);
   $e=curl_exec($ch);
var_dump($e);
0

Pieknie !!!!! mistrzu złoty. dziekuję za pomoc

0
te0dor napisał(a):

to nie to, klikając w ogłoszeniu w Pokaż (ajaxem pobierany jest telefon/javascript) i działa tyle razy ile chcę, no ale jak "niby" robie to curlem to juz mam error. podejrzewam ze źle to wykonuje curlem, albo nie uwzgledniam jakis zabezpieczen...

Oczywiście, że nie uwzględniasz. Serwis na bank sprawdza skąd przychodzą żądania i dla tych, które pochodzą ze strony puszcza bez problemu, a dla zewnętrznych stosuje ograniczenia.
Swoją drogą w jakim celu chcesz wyciągać numery telefonów?

0

a jednak nadal nie do końca zadowalające rozwiązanie :/ po pobraniu około 10 telefonow nastepuje blokada na jakiś czas

0

bo to nie jest żadne API, ty po części abusujesz ich system takimi requestami, więc Cię blokują. i tak post jest na tyle podejrzany, że powinien skończyć w koszu, na porady dot. możliwych blokad i sposobów ich omijania nie licz.
a najlepiej napisz do tablica.pl o udostępnienie jakiegoś API.

0

tablica.pl nie posiada żadnego API ani nie udostępni możliwości pobierań numerów tel. Po wyciągnięciu paru telefonów dostajesz bana i to nawet nie chodzi o wyciąganie telefonów po prostu jak z automatu wykonujesz zbyt dużo połączeń w zbyt krótkim czasie wyłapujesz automatycznie bana.

1 użytkowników online, w tym zalogowanych: 0, gości: 1