Problem rozpoznawania kolejnych wierszy i kolumn

0

Cześć, zastanawiam się nad stworzeniem programu, który ze zdjęcia bądź skanu będzie w stanie odczytać informacje z wierszy i kolumn tabeli, która będzie standardowo szablonowa.

Jakich narzędzi w Pythonie do tego użyć najlepiej?

0

Chodzi o to, by zrobić narzędzie typu OCR?
Jak tak, to chyba te narzędzie jest spoko: https://medium.com/@MicroPyramid/extract-text-with-ocr-for-all-image-types-in-python-using-pytesseract-ec3c53e5fc3a
Co do przykładów jego użycia: https://www.pyimagesearch.com/2017/07/10/using-tesseract-ocr-python/

0

Do rozpoznawania obrazu, możesz użyć sieci neuronowej (jedna z technik AI). Będziesz potrzebował nauczyć ją rozpoznawania komórek, a później danych w nich, więc najprawdopodobniej dwustopniowa nauka.
Zakładając tabelę nadrukowaną (nie będzie odręcznie kreślonych) prawdopodobnie powinieneś móc zrobić też wykryć za pomocą przekształceń (polecam PIL), teoretycznie możesz to zoptymalizować aby sieci neuronowej pozostało tylko rozpoznawanie danych w komórkach tabeli.

Do sieci neuronowej możesz wesprzeć się tym: https://towardsdatascience.com/how-to-build-your-own-neural-network-from-scratch-in-python-68998a08e4f6

Przynajmniej ja bym w ten sposób podszedł do problemu :)

1 użytkowników online, w tym zalogowanych: 0, gości: 1