Automat - sprawdzanie stron

0

Witam ,
Potrzebuję automat który z pliku XLS lub TXT lub DOC , będzie pobierał adresy stron www [, następnie do każdej się zaloguje (login i hasło) <- OPCJONALNIE ] w celu czy adres istnieje/jest dostępny .
Chyba wybór padnie na Selenium.

Jak macie jakieś propozycje proszę pisać - co do Selenium mam pytanko jak pobierać z pliku te dane (adresy URL) ?

0

Dane z pliku wczytujesz standardowo dla języka w którym piszesz.
Z formatami łordzikowymi trzeba się pewnie będzie trochę pobawić, ale to może pomóc(Jeżeli w javie piszesz)
http://stackoverflow.com/questions/7102511/how-read-doc-or-docx-file-in-java
https://gist.github.com/madan712/10641676

Selenium wydaje się ok, ale nie polecam używać standardowego drivera, bo będzie odpalał przeglądarkę za każdym razem więc będzie działał wolniej oraz pożerał zasoby przez co zrównoleglenie tego na kilku wątkach będzie problematyczne(overhead przeglądarki ubije zysk).
Zamiast tego możesz użyć np PhantomJS który pozwoli na wykonanie testu headless.

Jeżeli logowanie nie potrzebuje JS to możesz użyć JSoup zamiast Selenium.

1 użytkowników online, w tym zalogowanych: 0, gości: 1