Jak otworzyć bloba jako pdf

0

Cześć, mam taką małą zagwozdkę i nie wiem jak ją obejść. Mianowicie pobieram sobie jakiś plik z bloba w postaci bajtów:

blob = block_blob_service.get_blob_to_bytes('files', 'test.pdf')

i chciałbym go następnie tradycyjnym sposobem:

with open(blob, 'rb') as fh:

odczytać jako plik pdf jednak nie wiem jak to zrobić. W tej postaci, którą aktualnie mam otrzymuję błąd: "Error: expected str, bytes or os.PathLike object, not Blob".

Proszę o radę jak mogę pozbyć się problemu.

0

Czyli w pierwszym kroku wczytujesz bloba z pliku do pamięci, to po co chcesz potem otwierać jeszcze? Co jest twoim zamierzeniem. Co chcesz zrobić z tym PDFem?

0
Tomek Pycia napisał(a):

Czyli w pierwszym kroku wczytujesz bloba z pliku do pamięci, to po co chcesz potem otwierać jeszcze? Co jest twoim zamierzeniem. Co chcesz zrobić z tym PDFem?

Chcę zadziałać na nim skryptem do OCR, a funkcja "wejściowa" potrzebuje jako tako pliku .pdf, bo w obecnej formie tak jak już wspominałem mam błąd wymieniony w poprzednim poście.

0

To zapisz to co masz w blob do pliku tymczasowego. Ale ja bym sprawdził, czy nie można do tego OCRa podać tego co masz blobie. Jakiego OCR używasz?

0
Tomek Pycia napisał(a):

To zapisz to co masz w blob do pliku tymczasowego. Ale ja bym sprawdził, czy nie można do tego OCRa podać tego co masz blobie. Jakiego OCR używasz?

Właśnie za bardzo nie mogę stworzyć pliku tymczasowego, bo to funkcja azurowa, którą chcę otworzyć konkretny plik pdf z magazynu i następnie odczytać z niego pewne dane przy pomocy biblioteki tabula i pdfminer.

0

pdfmainer ma jakieś tam API, Poczytaj:
https://pdfminer-docs.readthedocs.io/programming.html

1 użytkowników online, w tym zalogowanych: 0, gości: 1