Jak wyświetlić kod strony www

0

Jak najłatwiej przechwycić kod strony www i władować go do jakiegoś stringa? Nie chodzi mi o zrobienie przeglądarki. Program ma robić coś takiego:
Wpisuję jakiś adres, wciskam ENTER i wyświetla mi się cały kod strony www.

Bardzo prosty, ale nie mam pojęcia jak go napisać. :(
Ps. Mam dostęp do Visual C++ i Visual .NET

0
  1. Po co ci to?
  2. Wcale nie takie proste... Przeczytaj RFC na temat HTTP :>
  3. Jest takie narzędzie jak curl, np.

curl www.wp.pl
i masz stronę.

  1. Są biblioteki: libcurl, DataReel, itd.
  2. Pod Windows jest WinInet...
0

zakladam, ze potrafisz juz uzywac socketow. teraz wiec wystarczy wyslac:

'GET /### HTTP/1.1\r\nHost: /$$$\r\nUser-Agent: /%%%\r\n\r\n'

'/###' sciezke do dokumentu
'/$$$' adres internetowy
'/%%%' nazwa programu, ktory sie laczy (nieobowiazkowe)

czyli np.
'GET /index.php HTTP/1.1\r\nHost: www.4programmers.net\r\nUser-Agent: mojaprzegladarka \r\n\r\n

0

Niestety na programowaniu sieciowym nie znam się w ogóle. :| Umiem zrzucić do pliku kod strony www.stronka.plem, chyba trochę na około bo przez polecenie system(), w którym wprowadzam linijkę: "GET www.stronka.pl / HTTP / 1.1 > plik"
Ostatecznie tak to rozwiążę, ale wolałbym zrobić to na Windowsie, bo nie mam u siebie Linuksa i żeby na nim pisać muszę łączyć się z uczelnią, a to nie jest wygodne.

Ps. Program jest po to, żeby łatwiej mi było napisać program troche trudniejszy :) Mam kilkaset adresów stron i chcę je posortować według pewnego kryterium, które znajduje się w ich kodzie. Jak będę umiał wczytać kod HTML każdej z nich to chyba sobie poradzę.
Ps2. Z socketów w programowaniu kokoRZystaćystać nie umiem [sciana]

0
skrzypol napisał(a)

Niestety na programowaniu sieciowym nie znam się w ogóle. :| Umiem zrzucić do pliku kod strony www.stronka.plem, chyba trochę na około bo przez polecenie system(), w którym wprowadzam linijkę: "GET www.stronka.pl / HTTP / 1.1 > plik"
Ostatecznie tak to rozwiążę, ale wolałbym zrobić to na Windowsie, bo nie mam u siebie Linuksa i żeby na nim pisać muszę łączyć się z uczelnią, a to nie jest wygodne.

To ściągnić curl-a dla Windowsa http://curl.haxx.se/download.html
wrzuć curl.exe do katalogu ze swoim programem (czy gdzieś na PATH) i daj w kodzie:

system("curl ADRES -o PLIK");

i w pliku PLIK masz źródło strony, będziesz miał takie samo rozwiązanie jak zrobiłeś na Linuxie (btw. curl dla Linuxa też jest...).

No a jeżeli czujesz się na siłach to biblioteki libcurl, albo DataReel.

0

najprościej:

URLDownloadToFile(0, "http://4programmers.net/Forum/viewtopic.php?id=75482", "c:\\topic 75482.htm", 0,0)

urlmon.lib

0

Dzięki, obydwa sposoby działają [browar]

1 użytkowników online, w tym zalogowanych: 0, gości: 1