Wczytanie strony internetowej, wyszukanie informacji

0

Witam, mam kawałek programu ale stanąłem na wczytaniu strony internetowej.

A więc jak wczytać stronę internetową (bez obrazków itp. sam tekst lub kod źródłowy) do programu tak by później w tym tekście wyszukać konkretne informacje??

Potrzebne mi inf. typu (przykład z gry internetowej w HTML):

  </li>
                  <li id="position5" class="buildingGround land">
                    <div class="flag"></div>
                    <a href="?view=buildingGround&amp;id=13488&amp;position=5" title="Wolne pole pod budowę"><span class="textLabel">Wolne pole pod budowę</span></a>
               </li>
                  <li id="position6" class="tavern">
                    <div class="buildingimg"></div>

                    <a href="?view=tavern&amp;id=13488&amp;position=6" title="Tawerna Poziom 3"><span class="textLabel">Tawerna Poziom 3</span></a>
               </li>
                  <li id="position7" class="branchOffice">
                    <div class="buildingimg"></div>
                    <a href="?view=branchOffice&amp;id=13488&amp;position=7" title="Bazar Poziom 1"><span class="textLabel">Bazar Poziom 1</span></a>
               </li>

No i z tego kawałka strony internetowej chcę wczytać dane o poziomie budynku Bazar.

Program ma wczytać cale źródło strony (lub od razu znaleźć informacje) tak bym mógł je wykorzystać w dalszym kodzie programu.

0

Do pobrania kodu html myślę że curl będzie dobry.
A jeśli chodzi o wyciągnięcie sensownych danych z tego bałaganu to wyrażenia regularne. Nowy standard c++ zawiera w sobie regexy.

0

Mógłbyś przytoczyć jakieś fragmenty kodu???

0

int writer(char *data, size_t size, size_t nmemb,
std::string *buffer)
{

int result = 0;

if (buffer != NULL)
{
buffer->append(data, size * nmemb);
result = size * nmemb;
}

return result;
}

curl = curl_easy_init();
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, writer);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, &buffer);

curl_easy_setopt(curl, CURLOPT_URL, "adresstrony");
curl_easy_perform(curl);

Curl to dobra biblioteka, bardzo prosta w użyciu :)

0

Dzięki

1 użytkowników online, w tym zalogowanych: 0, gości: 1