Analiza cudzej strony z linku URL.

0

Ciekawi mnie jak podejść do tematu analizy linków cudzej strony. Czyli tak jak to się dzieje np na g+ czy facebooku. User wkleja link a jakiś robot czy coś analizuję stronę wyciągając z niej potrzebne informacje. Wiem że na pewno będę musiał użyć ajaxu i innych tego typu rozwiązań. Nie wiem jednak jak do tego podejść. Bowiem nie wiem jak przeczytać kod cudzej strony mając do dyspozycji tylko link. Proszę o nakierowanie mnie na odpowiednie tory : )

2

Na pewno nie robisz tego po stronie klienta, tylko po stronie serwera.

  1. Od siebie ajaxem kierujesz do serwera: podaj mi info o stronie http://link.pl/
  2. Serwer robi jakieś file_get_contents (dla PHP) i pobiera źródło strony
  3. Serwer parsuje HTML (html parser nazwa_jezyka i znajdziesz) i wybiera potrzebne informacje - tytuł, czy opis meta to chyba nie problem, co do obrazków to podejścia są różne, na początku na pewno poszukuje obrazu oznaczonego og:image, a jak go nie znajdzie to już są różne algorytmy pobrania innych obrazków, ew. zostaje pobranie screenshota danej strony (poprzez odpowiednie oprogramowanie na serwerze, tego nie da się zrobić w samym PHP; ew. druga opcja to jakieś API do tych celów)
  4. Serwer pakuje zdobyte informacje w jakiś JSON albo inny XML i zwraca w odpowiedzi ajaxowej do klienta
  5. Po stronie klienta wrzucasz te informacje gdzie potrzebujesz
0

Ok, super! Czyli nie jest to takie trudne jak myślałem. Jedynie ten 4 punkt mnie przeraża ;D Nie korzystałem z JSON, tutaj będę musiał odrobić zadanie domowe ; )

0

JSON jest megaprosty i sprowadza się do użycia json_encode() w PHP i JSON.parse() w JS - w efekcie dostajesz (prawie) identyczne dane w formie zmiennej w JS, które spakowałeś sobie w PHP ;)

Do boju, jak coś to pytaj.

1 użytkowników online, w tym zalogowanych: 0, gości: 1