Próbuje wyciągnąć linki ze strony flickr.com ze zdjęciami, oto mój kod:
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
from urllib.request import urlopen, Request
import re
url="https://www.flickr.com/search/?text=fuji%20x-t10%20XF18-55"
images = []
def flickr():
#req = Request(url, data=None, headers={''})
page = urlopen(url)
soup = BeautifulSoup(page.read(), 'html.parser')
howmany = soup.find('a', {'class' : 'view-more-link'})
print('Znaleziono: ' + howmany.string[9:] + ' zdjęć.')
print(len(howmany))
photo_results = soup.find_all('div', {'class' : 'photo-list-photo-interaction'})
print(len(photo_results))
for photo in photo_results:
photo_link = photo.find('a', {'class' : 'overlay'})
print(photo_link)
flickr()
Z różnych DIVów i bezpośrednio z linków <A> próbowałem wyciągnąć dane i nic. Zawsze dostaje 0 rezultatów (print(len(photo_results)) ). Już nie wiem o chodzi.
User-agent jest (chwilowo) ominięty, ale stronę ściąga, bo przynajmniej wyświetla liczbę zdjęć na dane zapytanie.
Chciałem wyciągnąć linki do zdjęć high-res i później je ściągnać na dysk, ale coś mi nie wychodzi.
Help!