Jak znaleźć katalog? :: 4programmers.net

0

Muszę ściągnąć plik, który jest mi udostępniany, jednak zapomniałem nazwy jednego katalogu, a sporo czasu minie, zanim dostanę odpowiedź z poprawną ścieżką. W historii nic nie ma ;/
Np.: www.strona.pl/pliki/x/harmonogram.doc
I właśnie nie pamiętam nazwy tego katalogu "x". Strona ma włączone, że jeśli nie ma takiego adresu to włącza defaultową stronę, więc nie ma co liczyć że znajdzie się gdzieś w tej domenie katalog bez pliku index.html i tak dojdę ścieżką.

Niebanalny jest to problem, ale liczę że jacyś specjaliści przeglądają to forum.

1

Jeżeli jest to publiczy zasób to możesz zrobić coś takiego w Google:
harmonogram filetype:doc site:strona.pl/pliki

Ale Google bywa, że nie wszystkie strony ma w swoich zasobach. Możesz ograniczyć się do site:strona.pl/pliki - możliwe, że Twój plik nie będzie zaindeksowany, ale jakiś drugi z tego folderu, którego nazwy szukasz - owszem.
Sprawdź też istnienie pliku strona.pl/robots.txt - właściciel strony mógł nie chcieć, żeby boty indekstowały takie pliki, a dla Ciebie to dobre źródło poznać ścieżkę do folderu (o ile nie będzie tam zablokowanego po prostu /pliki/).
Ostatnia opcja to użyć jakiegoś HTTrack czy innego Teleport Pro i ściągnąć całą stronę na dysk (i np. ograniczyć się do pobierania tylko plików z folderu /pliki/ - cała strona będzie sprawdzona, ale nie cała zostanie zapisana) -- to jednak zejdzie co najmniej parę godzin, jeżeli strona to więcej niż 5 zakładek.

Możesz też po prostu wejść na stronę i samemu poszukać odnośnika to tego pliku ;P

Jeżeli zasób nigdy nie był publiczny to po prostu poczekaj na tę odpowiedź z poprawną ścieżką - nie ma magicznej opcji shakowania serwera, żeby Ci pokazał to, czego ma nie pokazywać. Możesz pisać skrypt sprawdzający wszystkie nazwy po kolei - aaa, aab, aac, aad, aae itd - ale to zajmie parę miesięcy jak nie lat, o ile nie dostaniesz zbanowany przez serwer - dlatego Ci mówię, że w przypadku niepublicznego zasobu - po prostu poczekaj na tego linka od kogośtam.

0

Na google wpadłem, ale nic nie dało.
Robots.txt nie istnieje najwidoczniej

Ściągać kawałka tej strony nie próbowałem, ale plik ten na pewno nie jest zlinkowany nigdzie.

Jak znaleźć katalog?

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami