Przeszukiwanie wszystkich plików pdf z katalogu

0

Mam kod :


def get_code_from_pdf(filename):
    raw = parser.from_file(r'C:\Users\cos\Desktop\cos2\pdf\get_plic.pdf)
    text = raw['content']

    for line in text.splitlines():
        opportunity_idx = line.lower().find('opportunity')
        if opportunity_idx > 0:
            return line.split()[0]
            
code_from_pdf = get_code_from_pdf(r'C:\Users\cos\Desktop\cos2\pdf\get_plic.pdf)
print(code_from_pdf)

Ten kod wyszukuje mi pewien napis z jakiejś tam linijki i on działa tylko że wyszukuje to z konkretnego pliku pdf a chciałbym żeby wyszukiwał ze wszystkich plików o formacie .pdf z katalogu (pdf)

próbowałem w ten sposób ale coś nie wyszło

raw = os.listdir(parser.from_file(r'C:\Users\gerc-1\Desktop\Get alert\pdf'))
0

@PythonDlaOpornego: https://stackoverflow.com/questions/3964681/find-all-files-in-a-directory-with-extension-txt-in-python

Pobierz ścieżki do wszystkich plików pdf z danego folderu w formie listy i przeiteruj po tej liście ze ścieżkami.

0

To będzie później program exe który docelowo będzie umieszczony w jakimś folderze, w tym folderze będzie folder o nazwie powiedzmy 'pdf' i z tego folderu ma odczytywać pliki pdf. Więc tak będzie dobrze ?

os.chdir("/pdf")
for file in glob.glob("*.pdf"):
    print(file)

jak puszczam to nie działa

0

@PythonDlaOpornego: Pokaż screena ze strukturą katalogów tego projektu i wklej polecenie którym odpalasz skrypt.

0

Ten program w sumie to może być już w tym samym katalogu co te pdf, byle by mi przeszukiwał informacje ze wszystkich pdf w tym katalogu w którym znajduje się program. W skrypcie nic nie zmieniałem jest taki sam jak na górze. Docelowo te nazwy będą trafić do excel, czyli zmienną ''pliki' przypiszę do którejś kolumny w Excelu żeby pod tą kolumną wypisało wszystkie zebrane informacje. Jeszcze nie wiem jak je wrzucić do excela ale będe szukał

0

Trochę pozmieniałem ale to dalej nie działa

akcja=os.chdir("/pdf")

def get_code_from_pdf(filename):
    
    for file in glob.glob("*.pdf"):
        raw = os.listdir(parser.from_file(akcja))
        text = raw['content']

        for line in text.splitlines():
            opportunity_idx = line.lower().find('opportunity')
            if opportunity_idx > 0:
                return line.split()[0]
            
code_from_pdf = get_code_from_pdf(akcja)
print(code_from_pdf)
0

@PythonDlaOpornego: Pytałem się wcześniej o screenshot struktury katalogów w tym projekcie.

akcja=os.chdir("/pdf")

"os.chdir" nic nie zwraca, więc bez sensu trzymać w ogóle taką zmienną.

1 użytkowników online, w tym zalogowanych: 0, gości: 1