Pobieranie zawartości stron i ich porównywanie

0

Cześć, mam za zadanie wykonać projekt sprawdzający zmiany jakie zaszły na pewnym portalu z narzędziami dla naukowców. Każde narzędzie ma swoją podstronę i link do strony głownej. Ja mam sprawdzać czy zaszły zmiany na stronie głównej takie narzędzia i teraz moje pytanie brzmi jak się do tego zabrać. Chce wykorzystać beautifulSoup do pobierania zawartości stron, ale pytanie co z przechowywaniem oraz jak pobrać wszystkie podstrony(w sensie wszystkie strony domowe programów). Zrobiłem prostą bazę z tabelą, w której chce przechowywać zawartość stron (czy to ma sens?).

0

Możesz korzystać z bazy danych, możesz zapisywać strony do pliku tekstowego, możesz budować csv, xml, rozwiązań jest wiele.
Do porównania zawartości możesz wykorzystać np bibliotekę difflib -> https://docs.python.org/3/library/difflib.html#differ-example

0

Wybór rozwiązania przechowywania danych w zasadzie zależy od formatu danych i ich ilości. Jak zauważył poprzednik opcji jest wiele, od siebie dodam że dodatkowo można dane przechowywać w: JSON lub yaml.

1 użytkowników online, w tym zalogowanych: 0, gości: 1