Problem rozpoznawania kolejnych wierszy i kolumn

Odpowiedz Nowy wątek
2019-05-15 12:14
0

Cześć, zastanawiam się nad stworzeniem programu, który ze zdjęcia bądź skanu będzie w stanie odczytać informacje z wierszy i kolumn tabeli, która będzie standardowo szablonowa.

Jakich narzędzi w Pythonie do tego użyć najlepiej?

Jaki format, do pdf sa narzedzia. - lion137 2019-05-15 13:38
W zasadzie większego znaczenia nie ma. Początkowo zdjęcie/skan zakładałem, że będzie jakimś obrazkiem jpg/png, ale chyba raczej nie ma problemu, żeby zrobić z tego pdf. - kamilos95 2019-05-15 13:41

Pozostało 580 znaków

2019-05-15 13:45
0

https://duckduckgo.com/?q=pyt[...]&iax=images&ia=images
Zobacz cos z tego.


Znaleźć biblioteki do obsługi pdf to akurat potrafię. Chodziło mi raczej o podpowiedzi osób, które robiły coś podobnego. Tak żeby z doświadczenia coś konkretnego polecić. Nie wiem np czy warto iść drogą z opencv czy są jakieś inne dobre i sprawdzone metody. - kamilos95 2019-05-15 15:18

Pozostało 580 znaków

2019-05-16 12:54
0

Chodzi o to, by zrobić narzędzie typu OCR?
Jak tak, to chyba te narzędzie jest spoko: https://medium.com/@MicroPyra[...]sing-pytesseract-ec3c53e5fc3a
Co do przykładów jego użycia: https://www.pyimagesearch.com[...]0/using-tesseract-ocr-python/


"Chodzenie po wodzie i tworzenie oprogramowania wg specyfikacji są łatwe, o ile woda i specyfikacja są zamrożone" - Edward V. Berard
Docelowo tak. Ale na tym etapie chciałbym mieć możliwość rozpoznawania komórek, z których chcę coś odczytać. Więc bardziej chodzi mi o narzędzie, którym na zdjęciu rozpoznam, w którym miejscu występuje jakaś dana. - kamilos95 2019-05-16 12:57

Pozostało 580 znaków

2019-05-17 12:29
0

Do rozpoznawania obrazu, możesz użyć sieci neuronowej (jedna z technik AI). Będziesz potrzebował nauczyć ją rozpoznawania komórek, a później danych w nich, więc najprawdopodobniej dwustopniowa nauka.
Zakładając tabelę nadrukowaną (nie będzie odręcznie kreślonych) prawdopodobnie powinieneś móc zrobić też wykryć za pomocą przekształceń (polecam PIL), teoretycznie możesz to zoptymalizować aby sieci neuronowej pozostało tylko rozpoznawanie danych w komórkach tabeli.

Do sieci neuronowej możesz wesprzeć się tym: https://towardsdatascience.co[...]cratch-in-python-68998a08e4f6

Przynajmniej ja bym w ten sposób podszedł do problemu :)


Linux Mint
Arduino / Python 3.5.2
edytowany 1x, ostatnio: Guaz, 2019-05-17 14:48

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0