Automatyczna nazwa na podstawie zawartości pliku.

0

Witam,

Da się napisać program który z zeskanowanego pliku pdf zczyta numer i zmieni nazwe tego pliki? Np. Skanuje etykietę mleka, na komputerze wrzucam plik w program, program zmienia nazwe pliku na mleko. Dla utrudnienia nie mogę w pracy ściągać rzeczy na firmowy komputer wiec VBA lub programy dostepne w Windowsie 11.

1

Da się.

2

jak to jest zeskanowany pdf (tj. jedno zdjęcie a nie wyszczególniony tekst) to nie obędzie się bez OCRa a to może być ciężkie bez instalacji żadnych zewnętrznych zależności

3

Na takiej etykiecie może być dużo teksu, poza tym, że odczytasz z niej tekst to i tak nie będziesz pewny, którego użyć.

Możesz też zrobić hashmapę z kluczowymi nazwami, które determinują czym jest dany przedmiot i sprawdzić wyrazy z OCRa, czy występują w bazie jak tak to będziesz wiedział, który jest kluczowy wyraz, znaczący.

Inna heurystyka to mógłbyś wybrać tekst z największą czcionką.

Ewentualnie żeby sieć neuronowa zadecydowała czy dany wyraz jest wyrazem produktu czy może czymś innym i wtedy byś wiedział, które wyrazy z danego obrazka są kluczowe.

Ja jako człowiek jakbym spojrzał na tą etykietę to też bym nie wiedział jak podpisać plik, czy chcesz jaki to produkt mleko, mięso, czy może jaka to firma od mleka, łaciate, łowickie czy jakie tam są te mleka.
A program musi być dość precyzyjnie określony co do tego co ma zrobić i jak wygląda to na podstawie czego ma decydować o tym.

0

Tekst jest zawsze w tym samym miejscu praktycznie największą czcionką. Nazwa ma mieć taką samą liczbę znaków tylko różną kombinację. Gdyby plik był w Wordzie to podejrzewam, że napisanie tego to byłby banał.

P.s dzięki za wyczerpujące odpowiedzi.

1 użytkowników online, w tym zalogowanych: 0, gości: 1