parsowanie źródła strony

0

Witam,

używam biblioteki cURL do pobierania źródła strony, ale chciałbym z niego wyciągnąć tylko te informacje, które są mi potrzebne. Nie wiem jednak jak się za to zabrać, podobno nazywa się to parsowanie. Robi się to za pomocą tej biblioteki cURL?

Proszę o pomoc.

0

Nie. Możesz to zrobić np. używając biblioteki libXML

0

dzięki, a mogę Cię jeszcze prosić o pomoc z instalacją tej biblioteki pod VS, bo nie za bardzo wiem gdzie mam co przekopiować itd.?

0

użyj wyrażeń regularnych, xml się nie nadaje do parsowania stron!

0

ok, korzystam w wyrażeń,
tylko nie mogę wypisać kilku wystąpień w przerabianym tekście, nie wiem jak to zrobić.

  smatch res; 
    str = "dsfgd@gdfgsd@gdgsgfd@gdgfd@errger@"; 
    regex rx("@(.*?)@"); 
  
    
  
    while(i!=10) 
        {i++; 
        regex_search(str, res, rx); 
  
        cout << res.str() << endl; 
  
        } 

jak to zrobić? bo wypisuje mi tylko pierwszy, nie wiem jak przeskoczyć o następnego.

0

A z jakiej biblioteki regex korzystasz? Sądzę, że będzie to zapisane w jej dokumentacji.

0

to znaczy to jest podstawowa biblioteka , która jest od razu w VS2010

1 użytkowników online, w tym zalogowanych: 0, gości: 1