skrypt do wyciągnięcia tekstu ze strony internetowej

0

Witam wszystkich.
Proszę o pomoc: gdzie znajdę skrypt (a może ktoś mógłby napisać, jeśli nie jest zbyt długi ) do wyciągnięcia tekstu ze strony internetowej.
Od razu mówię, że nie znam Pythona.
Tłumacząc strony internetowe, często trzeba zrobić wycenę za ilość tzw. normostron ( czyli 1800 zzs). Aby to policzyć, trzeba mieć cały tekst. Niestety, zleceniodawcom nie zawsze się chce ( nie zawsze mogą) taki tekst wyeksportować.
Czy jest jakiś mały skrypt, działający na zasadzie : kod ---->adres strony ----> kod i mam zapisany tekst w jakimś pliku. Nie musi być on sformatowany, ale żeby każdy wyraz był osobno.
Dziękuję i pozdrawiam.

3

Za darmo nikt sie tego nie podejmie. Jesli masz zamiar zrobic to samo to odsylam do dokumentacji requests :)

3

a nie wystarczy ctr+c potem ctr+v np: do Worda? W zestawieniach pliku będą statystyki.

2

poszukaj apek do webscrapingu. Jest kilka. Jedna z nich https://webscraper.io/

0

@KaDwa
Jasne, że wystarczy. Problem zaczyna się, gdy masz sklep internetowy z kilku- a czasami kilkunastoma tysiącami produktów i każdy ma własną podstronę z opisem. Ręczne kopiowanie tego i wklejanie do Worda to ogrom pracy. I jeszcze łatwo o pomyłkę
@Inari
Wielkie dzięki. Popatrzę na to.

W każdym razie dziękuję wszystkim. Jakby co, to wrzucę ogłoszenie.
Pozdrawiam.

0

Wgraj sobie do chrom, graficzny selektor za jego pomocą wygeneruj formuły na tekst.=, potem uzyj ich crawrerze, lub napisz go sobie sam. Ułożenie tych formułek to najbardzie skoplikowana cześć, reszte bez problemu wygooglujesz ;)

0

Proponuję: ParseHub. Wersja darmowa ma pewne ograniczenia, ale działa poprawnie (nie wiem jedynie jak sobie radzi z zabezpieczeniami przed web scrapingiem)
Pisanie skrobaka indywidualnie, to dla każdej strony/sklepu będzie oddzielny algorytm (tak zakładam).

1 użytkowników online, w tym zalogowanych: 0, gości: 1