Wyodrębnianie kodu ze strony

0

Potrzebuję pobrać pewien tekst ze strony www (dokładnie kod sms przy płatnym serwisie) do Edita. I tutaj pojawia się problem. Na początku próbowałem do memo pobrać kod html strony (na podstawie rozdziału z książki Delphi 7 Ćwiczenia Zaawansowane) a następnie wyodrębnić ten fragment o który mi chodzi i przesłać do Edita. I udałoby mi się to gdyby to nie było połączenie szyfrowane. Cały kod html pozostaje bez zmian. Zmienia się jedynie kod (ale też ma stałą liczbę znaków). Ma ktoś pomysł jak wyodrębnić ten kod ze strony?

0

Nie wiem o jaką stronę chodzi, ale chyba nawet jak strona jest w połączeniu szyfrowanym to da się
wyświetlić jej źródło. Ja używam Opery i wystarczy że wcisnę CTRL+U i mam kod strony, teraz ów
kod należy odpowiednio sparsować. O ile w kodzie strony między jakimiś znacznikami znajduję się
hasło sms to powinieneś je wyłapać. Może pomoże Tobie napisany przeze mnie parser do pobrania
ze strony poniżej. Powstał on aby wyodrebnić linki do ikon znajdujących się na podstronach na:
http://icone.goldenweb.it, szczególnie zwróć uwagę na funkcję ExtractValue i jej wywołanie w
kodzie przycisku ParseHtmlBtn.Może to Ci się do czegoś przyda, napisz czy to Ci coś dało.
Kod Html Parsera pod Delphi 7 wrzuciłem na: http://www.speedyshare.com/704805479.html

0

Ale to nie o to chodzi. W przeglądarkach spokojnie można przeglądać kod. Natomiast kiedy chcę programowo wyodrębnić kod html ze strony z połączeniem szyfrowanym to wywala błąd. Przy innych stronach jest wszystko ok. Korzystałem z komponentu TidHTTP.

0

tajpan Daj kod programu !
Spróbuję pomóć !

0

http.rar
Tutaj masz kod.

0

Trzeba napisać wyszukiwarkę która kasuje z pobranego źródła znaczniki np. i usuwa to co jest przed tym i za tym<body> i </body>.
1.Wyszukuje w tekstu np.<body> i usuwa to co było przednim.
2.Usuwa wszystko co jest za np. </body> i na końcu kasuje <body> i </body>.

0

No tak, ale jak to zrobić skoro nie chce pobrać kodu strony tylko wywala błąd. Przy normalnych stronach jest ok, tylko przy szyfrowanych pojawia się problem.

0

Jak pobrać kod ze strony ?
po prostu zrób tak :
1.Wstaw na formę THTTPGET i TMEMO oraz TBUTTON.
2.Kliknij dwa razy w Button I WPISZ :

httpget1.url:=[edit1.text];
// Adres URL; 
httpget1.getstring;
// Wykonanie operacji !  

3.Kliknij dwa razy w HTTPGET i w Object Inspektorze kliknij na zakładkę Events kliknij dwukrotnie w miejsce na tekst obok onDoneString i wpisz:

Memo1.Text:=Result; 

Pisałem z pamięci !

0

I jak Ci się uda zrobić wyszukiwarkę proszę podziel się mi nie wychodzi !

0

Akurat potrafię pobrać kod strony do memo, potrafię wyodrębnić kod ze strony. Chodzi mi o POŁĄCZENIA SZYFROWANE. Kiedy chcę pobrać kod ze strony, wywala mi błąd. W przypadku zwykłych stron jest wszystko ok

0
ziomalski1 napisał(a)

I jak Ci się uda zrobić wyszukiwarkę proszę podziel się mi nie wychodzi !

Bo ześ się uparł na ten httpget niemiłosiernie, który ci na to nie pozwoli, żeby coś takiego osiągnąć. A kłócić się będziesz dalej, znając Ciebie.

0

To skoro nie uda się za pomocą httpget to jakiego komponentu użyć?

0

Poczytaj o Indy i IdHTTP

1 użytkowników online, w tym zalogowanych: 0, gości: 1