Zapis strony internetowej do pliku txt

Odpowiedz Nowy wątek
2012-09-09 10:59
0

Witam w jaki sposób zapisać strone np www.4programmers.net/
by zapis był identyczny z tym jak zapisujemy stronę w przeglądarce -- zapisz jako - plik tekstowy ??

bo zapis : - Daje jej "kod"

var
S: string;
IdHTTP: TIdHTTP;
begin
IdHTTP := TIdHTTP.Create(nil);
try
S := IdHTTP.Get('http:/www.4programmers.net');
memo1.Text:=s;
finally
IdHTTP.Free;
end;
end;

edytowany 1x, ostatnio: B_R_U_T_U_S, 2012-09-09 10:59

Pozostało 580 znaków

2012-09-09 11:50
0

Nigdy nie zrobisz tego "tak samo" bo nigdy nie jest "tak samo". Każda przeglądarka implementuje to na swój sposób. Ma do tego cały mechanizm, sama ustala reguły.

Napisanie własnego mechanizmu nie będzie proste. Trzeba jakoś symulować layout!!! Czyli musiałbyś mieć w zasadzie cały silnik przeglądarki.

Jedyny pomysł jaki mi przychodzi do głowy to załadowanie strony do ukrytej kontrolki (np. ActiveX) jakiejś przeglądarki (IE/ mozilla). Ale i tak zaczynają się schody. Jak ją zmusić do zapisania strony w txt tak by było to niewidoczne dla użytkownika? Nie mam pomysłu...

edytowany 1x, ostatnio: adf88, 2012-09-09 11:51

Pozostało 580 znaków

2012-09-09 12:07
0

Jak ją zmusić do zapisania strony w txt tak by było to niewidoczne dla użytkownika

Można kontrolkę umiejscowić gdzieś daleko poza formą.


Odnośnie pytania - możesz wyłuskiwać tekst spomiędzy znaczników, wtedy efekt będzie podobny.
Np.jeżeli mamy stronę o kodzie:

<html>
<head>
<title>tytuł</title>
</head>
<body>
<p style='text-align:center'>foo</p>
</body>
</html>

Należy najpierw wyłuskać tekst spomiędzy <body>...</body>, a potem spomiędzy znaczników p, span, div i tym podobnych.
Taka okrojona wersja prostego silnika do przeglądania stron.


edytowany 1x, ostatnio: Patryk27, 2012-09-09 12:07

Pozostało 580 znaków

2012-09-09 12:19
-123oho
0

Odnośnie pytania - możesz wyłuskiwać tekst spomiędzy znaczników, wtedy efekt będzie podobny.

Bardzo, na pewno samemu się zrobi z <br> nowa linia.

Należy najpierw wyłuskać tekst spomiędzy <body>...</body>, a potem spomiędzy znaczników p, span, div i tym podobnych.
Taka okrojona wersja prostego silnika do przeglądania stron.

Piszmy silniki przeglądarek.

Ja mam inne pytanie: Po co ci to. Nie widzę praktycznego zastosowania, a pewnie newbi wymyślił kolejny genialny pomysł.

Pozostało 580 znaków

2012-09-09 12:23
0
-123oho napisał(a)

Piszmy silniki przeglądarek.

Nie od razu pełne silniki, ale stworzenie najprostszego nie jest przecież niczym trudnym (po prostu obsługa podstaw samego HTML'a).
Nikt tutaj nie mówi o pisaniu kolejnego Explodera.


edytowany 2x, ostatnio: Patryk27, 2012-09-09 12:24

Pozostało 580 znaków

2012-09-09 12:27
-123oho
0
Patryk27 napisał(a):
-123oho napisał(a)

Piszmy silniki przeglądarek.

Nie od razu pełne silniki, ale stworzenie najprostszego nie jest niczym trudnym przecież (czyli po prostu obsługa podstaw samego HTML'a).

Tylko problem w tym że jeżeli napiszesz mizerny silnik to wynik będzie mizerny (albo jeszcze bardziej mizerny). Jeżeli uważasz że dzisiaj strony bazują na samym HTMLu to się mylisz... Już nie mówiąc że sam standard HTML też nie jest prosty. Twoje rozwiązanie będzie działać tylko w cieplarnianych warunkach. Nie widzę sensu pisania czegoś w czym nie osiągniesz prawie żadnego wyniku zwłaszcza że nie masz lat na rozwijanie tego.

Pozostało 580 znaków

2012-09-09 12:29
0

jest proste rozwiązanie gotowiec - http://htmlp.sourceforge.net/
oryginalnie stworzony do zamieniania "html" w poczcie na plain text

Pozostało 580 znaków

2012-09-09 13:23
0
szopenfx napisał(a):

jest proste rozwiązanie gotowiec - http://htmlp.sourceforge.net/
oryginalnie stworzony do zamieniania "html" w poczcie na plain text

Wielkie dzieki !!!

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0