Witam,
ostatnio na jednym z portali ogłoszeniowych znalazłem zlecenie dotyczące zbierania danych firm z serwisu pf.pl. Temat ten zainteresował mnie, ponieważ nigdy nie miałem okazji robić coś podobnego.. (w ogóle mój związek z Web'em to jedynie proste strony html/php).
Zastanawiam się, jak tego typu zadanie zostałoby zrealizowane od strony programistycznej? Jeżeli byłoby udostępniane API serwisu, to wtedy można byłoby wszystko bardzo łatwo obsłużyć. Co w przypadku, gdy takowego API brakuje... czy realizowane jest to w taki sposób, że pobierana jest zawartość jakiejś podstrony serwisu i według 'przyjętego wzorca' (regex) wyszukiwane są pożądane informacje ? Ale chyba tego typu 'zabiegi' nie są zbyt wydajne ? Poza tym jak przechodzić po wszystkich podstronach danego serwisu ? (a najlepiej w tym przypadku po podstronach będących 'wizytówką' danego przedsiębiorstwa).
Ogólnie proszę o wypowiedzenie się w temacie ;)