Konwerter HTML+JS do czystego tekstu

0

Poszukuję programu, który pobiera plik HTML i wypluwa plik tekstowy zawierający to samo, co bym otrzymał poprzez zaznaczenie tego, co wyświetliła przeglądarka, skopiowaniu i wklejeniu do notatnika.

Swoisty parser HTML.

Dla przykładu - w pliku wejściowym mam:
<b>a</b><script>document.write('B');</script>c
Wyświetla się:
aB<font color="red">c</span>
A w pliku wynikowym mam:
aBc

<font size="1">Jak to ostatnio u mnie bywa - piekielnie pilna sprawa [green] [wiem, nikogo to już nie wzrusza :D]
chyba powinienem iść już spać.....</span>

0
<?PHP strip_tags(); ?>

jak chcesz okienkowe, to w PHP-GTK 2 :)

0
ToPeR napisał(a)
<?PHP strip_tags(); ?>

to zostanie document.write - poza tym trudno tak żeby analizował też javascript znaleźć program, no ale to pół minuty robienia w delphi przy kontrolce IE - wystarczy coś w stylu:

var plik: TextFile;
begin
WebBrowser1.Navigate(ParamStr(1));
AssignFile(plik, ParamStr(2));
Rewrite(plik)
Write(plik, WebBrowser1.OleObject.Document.body.innerText);
CloseFile(plik);
end;

tak na oko ;)

0

Zaraz sprawdzę..<font color="red">*</span> ale jeśli się nie mylę, to ta linijka:
WebBrowser1.Navigate(ParamStr(1));
wyświetli ten plik w okienku? no i to trwa wieeeeeeki i tego chciałem uniknąć :/


<font color="red">*</span>nie sprawdzę, bo po reinstall windows zgubił się klucz rejestrujący Delphi i nie działa :/

1 użytkowników online, w tym zalogowanych: 0, gości: 1