Witam.
Chciałbym wyciągnąć z obrazka, na którym zapisany jest zeskanowany dokument magazynowy zawartość tabeli zawierającej pozycje tego dokumentu.
Próbowałem już to robić bibliotekami Tesseract oraz IronOCR ale w obydwu przypadkach dostaję tekst, który jest zbity w jeden ciąg bez rozróżnienia na poszczególne komórki.
Znalazłem rozwiązania, które rozpoznają najpierw komórki tabeli a potem wybiera ich zawartość. Jednak są one napisane w pythonie i nie rozumiem z jakich bibliotek korzystają:
https://stackoverflow.com/questions/59580304/extract-individual-field-from-table-image-to-excel-with-ocr)
https://pythonrepo.com/repo/eihli-image-table-ocr-python-computer-vision
Czy ktoś może spotkał się z takim podejściem napisanym w C#? Wystarczyło by mi rozpoznawanie położenia poszczególnych komórek tabeli a wyciagnięcie ich zawartości bym już zrobił.
Oczywiście zakładamy że tabela jest w pełni narysowana ale może mieć wiersze różnej wysokości.