Skan dokumentu pdf - wyrównanie

0

Szukam rozwiązania które umożliwi mi automatyczne wyrównanie dokumentu faktury (skany mogą być wykonane krzywo) bez utraty jakości. Skany są w formacie pdf. Chciałbym aby na wyjściu też był pdf (byte[], Stream), ponieważ stron w pdfie może być wiele, żeby tego nie dzielic na pojedyńcze obrazki.

0

Wyrównywanie, czyli że co? Jak to są obrazki to jedyna opcja to znaleźć główny element na obrazku i go wyrównać - do tego potrzeba analizy obrazów (tak zwanego AI). Możesz poszukać jakichś usług pod to - zsatanawia mnie tylko po co tego potrzebujesz. Co chcesz przez to osiągnąć?

0

@UglyMan: Wyrównanie czyli, jeżeli skan dokumentu (faktury) jest zrobiony krzywo, to chce wyprostować ten skan np według tekstu w nim zawartego (poniżej przykład). Potrzebne mi to ponieważ chce na pdf wykonywać ocr, a potem znaleźć konkretną wartość a następnie przeszukiwać dane po jego lewej stronie jak i powyżej, nic poza tym.
abbott2.jpgabbott2_textdeskew_a85_m2p0065.jpg

0

No ale poco to równać, jak i tak w OCR wrzucasz?

0

@UglyMan: Ponieważ jezeli znajde konkretna wartość to potem chce szukać po jej lewej stronie innych wartości. jeżli strona bedzie pochylona to ich nie znajdzieexmpl.png

1

Określanie czegoś jako poniżej czy po lewej w przypadku OCRa to trochę słabe. Myślę, że powinieneś znaleźć inną metodę analizowania pól. Nie wiem, pod co to chcesz używać, ale jest dużo narzędzi, które skanują faktury i dodatkowo "uczą się" same na podstawie wyborów użytkownika.

0

Mam rozbudowane narzędzie, które analizuje pliki pdf i je "rozbiera" na atomy. Na wyjściu dostajesz listę obiektów (z typem obiektu, ewentualnym tekstem oraz współrzędnymi). Jeśli byłbyś zainteresowany, to napisz do mnie: [email protected].

1 użytkowników online, w tym zalogowanych: 0, gości: 1