Parsowanie strony w php

0

Witam mam problem z parsowaniem strony prosto chce uzyskac kod html w C# 2010 net4.0

WebClient webClient = new WebClient();
webClient.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
string strr = webClient.DownloadString("http://www.prosto.pl/?l=pl&m=sklep&w=ubranialista");
MessageBox.Show(strr);

3

Każdy ma jakiś problem, ale nie wiem na czym Twój polega.

0

Wydaje mi się, że kolega chce mieć HTML (source strony) uporządkowany, tj. ze wszystkimi wcięciami, elegancko, jedno pod drugim.....Też bym chciał, ale nie znalazłem jeszcze nic takiego :(

Aks

0

Nie ogarniam. A ten kod co podał rpyndus nie robi dokładnie tego?

0

chyba nikt nie spróbował odpalić tego kodu... problem leży w tym, że nie wyświetla się źródło. Ogólnie próbowałem robić to dla innych stron(również z argumentami GET) i działało. Dla czego nie działa akurat ta strona - nie wiem

0

Po zbadaniu strony przeglądarką Chrome lub dodatkiem do Firefox'a Firebug można zauważyć, że strona tworzy sesje. Nie jestem pewny, ale według mnie to. Raczej z WebClienta będzie trzeba zrezygnować. Poczytaj o tym: http://msdn.microsoft.com/en-us/library/system.net.httpwebrequest.cookiecontainer.aspx

1 użytkowników online, w tym zalogowanych: 0, gości: 1