Odczyt zawartości tabel z obrazka OCR

0

Witam.
Chciałbym wyciągnąć z obrazka, na którym zapisany jest zeskanowany dokument magazynowy zawartość tabeli zawierającej pozycje tego dokumentu.
Próbowałem już to robić bibliotekami Tesseract oraz IronOCR ale w obydwu przypadkach dostaję tekst, który jest zbity w jeden ciąg bez rozróżnienia na poszczególne komórki.

Znalazłem rozwiązania, które rozpoznają najpierw komórki tabeli a potem wybiera ich zawartość. Jednak są one napisane w pythonie i nie rozumiem z jakich bibliotek korzystają:
https://stackoverflow.com/questions/59580304/extract-individual-field-from-table-image-to-excel-with-ocr)
https://pythonrepo.com/repo/eihli-image-table-ocr-python-computer-vision

Czy ktoś może spotkał się z takim podejściem napisanym w C#? Wystarczyło by mi rozpoznawanie położenia poszczególnych komórek tabeli a wyciagnięcie ich zawartości bym już zrobił.
Oczywiście zakładamy że tabela jest w pełni narysowana ale może mieć wiersze różnej wysokości.

0

Tesseract ma eksport do hOCR lub XML, a w tym formacie każde słowo lub każda litera jest zapisane osobno ze współrzędnymi.

Inna opcja to Google API jest rozpoznawanie, tylko, że płatne (na początku jest chyba 45-dniowy bezpłatny okres próbny), Tam też jest możliwe uzyskanie informacji o współrzędnych poszczególnych słów lub znaków.

Mając słowa lub znaki ze współrzędnymi już można odtworzyć pierwotny układ tekstu i można pokojarzyć poszczególne wiersze tabeli.

1 użytkowników online, w tym zalogowanych: 0, gości: 1