Web Scraping z Google Drive

Hej,
chciałem zapisać każde ze zdjęć z klasą "ndfHFb-c4YZDc-cYSp0e-DARUcf-RJLb9c" a potem użyć convertera żeby zrobić z nich PDF-a. Niestety src należący do każdego z tych tagów img wcale nie otwiera zdjęcia . Można to obejść używając inspektora w Firefoxie. Klikając PPM na tag img z wspomnianą klasą jest opcja Copy -> Image Data-URL , otwierając skopiowany w ten sposób link mamy już możliwość zapisania tego zdjęcia. Oczywiście nie chcę powtarzać tej czynności 304 razy XD

Ma ktoś może pomysł jak to zrobić? Próbowałem też używać biblioteki "puppeteer" w Node.js ale nic z tego. Jest wgl możliwym odfiltrowanie tych Image Data-URL i zapisanie ich w tablicy?

Coś na tej zasadzie:

const srcCodes = [];
document.body.childNodes.forEach(node => {
    if (node.className === "someClass") {
        srcCodes.push(node.src);
        // zamiast "src" właśnie to "Image Data-URL"
    }
});

Chodzi o ten plik: https://drive.google.com/file/d/0B4R7VqKkZoPgaXdod1pyMlNpVTQ/preview

Coś takiego powinno dać radę:

const getBase64Image = img => {
    const canvas = document.createElement("canvas");
    canvas.width = img.width;
    canvas.height = img.height;

    const ctx = canvas.getContext("2d");
    ctx.drawImage(img, 0, 0);

    return canvas.toDataURL("image/png");
}

const elements = document.getElementsByClassName('ndfHFb-c4YZDc-cYSp0e-DARUcf-RJLb9c');

Array.from(elements).map(img => getBase64Image(img));

@Haskell: Dzięki wielkie :) Wiesz może, czy mógłbym jakoś złapać dane z tego linka w VanillaJS? Później będę musiał zapisać każde ze zdjęć w folderze numerując je po kolei, jakieś wskazówki jak się za to zabrać?

Liczba odpowiedzi na stronę

Web Scraping z Google Drive

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami