Jestem zupełnie zielony od czego zacząć - program zczytywania danych ze stron www

0

Jestem zupełnie zielony - może prawie zupełnie dawno temu liznąłem jakieś podstawy programowania w pascalu.

Chciałbym sobie odświeżyć temat programowanie i może w tą stronę się rozwijać. Nie mam zamiaru czytać książki za książką i przerabiać w niej podanych przykładów tylko postarać się napisać coś konkretnego - coś co jeśli się uda nawet będzie działało i będzie przydatne i w ten sposób się nauczyć.

Pomysł na program już jest ale nawet nie kojarzę czego użyć więc proszę przynajmniej o nakreślenie dobrych kierunków poszukiwań.

Program na "wchodzić" na stronę www na tej stronie wyszukiwać jakieś wyrazy, i jak znajdzie je to wychodzić i do pliku zapisywać jakieś np ile razy ten wyraz wystąpił, i na następną stronę i znów ma ja przeczytać przeanalizować i zapisać coś o niej.

dobrze by było żeby program sam działał niezależnie od włączenia mojego komputera - więc trzeba go umieścić w jakiejś chmurze albo na serwerze. Ale na początek może pracować tylko na moim lokalnym komputerze.

Jak się za taki temat zabrać i jakiemu językowi przyjrzeć się dokładniej?

Z góry bardzo dziękuję za wszelakie podpowiedzi.

Marcin

0

Poczytaj o web scraping. Język np. python.

0

Jak nie masz zamiaru czytać książek, to nie bierz się za programowanie.

1

Książki czytać zamiar mam nie o to chodzi.
Nie mam zamiaru od deski do deski czytać i po kolei przerabiać przykładów zamieszczonych w tych książkach. Próbowałem - efekty mizerne. A i mądrzejsi mówią, że nie tędy droga. Dlatego stawiam sobie konkretne zadanie i będę dążył do jego rozwiązania.

A teraz przynajmniej wiadomo co czytać np python

0

Polecam od Python i Ruby, wraz z frameworkiem są bardzo dobre w tym zarobki, a Python niedługo wyprzedzi na tiobe C#. Które jak wiadomo Microsoft zawyża wpłatami na tej stronce.

0

Napisałem w Pythonie taki program, który używa wyrażeń regularnych do szukania danych ciągów na stronie i w linkach na danej stronie. Można go użyć do szukania określonych wyrazów tylko na jednej stronie zmieniając odpowiednio plik konfiguracyjny: https://github.com/arkadiusz97/RegexBot

1 użytkowników online, w tym zalogowanych: 0, gości: 1