Odczytywanie danych ze skanów

0

Dzień dobry,

piszę z kumplami pracę magisterską na temat związany z mechaniką gazów. W skrócie, jest to program, który ma służyć wstępnemu obliczaniu dysz silników rakietowych. Chodzi o to, by taki program wykonywał wstępne zgrubne symulacje, na podstawie poszczególnych paliw i ich właściwości. Nie ma problemu z logiką programu, rzecz w czym innym.

Otóż do sprawdzenia jest ogromna liczba różnego rodzaju paliw rakietowych. Stwierdziliśmy, że warto się posłużyć danymi pochodzącymi z zaufanych źródeł i takim np. jest amerykańskie ministerstwo obrony, albo NASA. Z tym większość z tych danych jest podana w postaci skanów jakichś dokumentów, na których są różnego rodzaju wykresy, albo tablice, których nijak nie mogę chociażby wrzucić do Excela. Pytanie jest następujące - czy istnieje jakiś prosty sposób, może jakaś biblioteka służąca do przetwarzania obrazów, której mógłbym użyć do pobrania tych danych bez żmudnego wklepywania do Excela?

Może jest jakaś ciekawa książka dotycząca takich rzeczy?

Z góry dzięki za odpowiedź.

0

Wszelkie automaty mogą się mylić.
Obecnie OCR'y są coraz lepsze, ale i tak nie są nieomylne. Do tego jeszcze dochodzi taki czynnik, jak jakość skanów oraz to, o czym piszesz - czyli "dziwny" układ treści na tych dokumentach, a także ich zawartość (tabelki, wykresy itp.).

W każdym razie - ja bym nie opierał swojej magisterki na danych pozyskanych w ten sposób. Mogą dzięki temu pojawić się dziwne wyniki, które negatywnie wpłyną na ocenę całej pracy.

0

może ABBYY FineReader

1 użytkowników online, w tym zalogowanych: 0, gości: 1