wrzucenie pliku tabelki z pliku pdf do excela

0

witam, mam nadzieję, że jest to właściwy dział

zajmuję się amatorsko, jednak z pewnymi sukcesami, inwestowaniem na GPW. moja metoda polega z grubsza na szczegółowym analizowaniu sprawozdań finansowych, wyciąganiu z nich potrzebnych danych i na ich podstawie ocenie kondycji finansowej firmy. jest to strasznie żmudna robota, w związku z czym zacząłem myśleć nad jej uproszczeniem i przyspieszeniem. pomyślałem, że warto byłoby nauczyć się jakiegoś języka, który umożliwi mi wgląd w plik pdf, odczytanie zeń tabelki i wrzucenie jej do excela, stąd
**1) **czy jest to coś trudnego, wymagającego długiej nauki
**2) **jeśli nie, to od czego powinienem zacząć, żeby szybko być w stanie to napisać

"znajdź informatyka, który Ci to napisze" - jeśli odpowiedź na 1) brzmi 'tak', to wtedy się zgodzę jeśli 'nie', to dużo bardziej wolałbym mieć wgląd w kod i możliwość jego swobodnej i świadomej modyfikacji

tl;dr chcę napisać program, który wrzuci mi tabelkę z pdf'a do excela, nic nie umiem z programowania, czego potrzebuję się nauczyć

0

Jeżeli musi to być koniecznie pdf to pozostaje raczej tylko ocr (rozpoznawanie pisma). Są gotowe programy do tego, są też gotowe biblioteki których programista może użyć aczkolwiek temat nie jest taki prosty jak by sie wydawało, raczej powinieneś porzucić zamiary samodzielnego napisania takiego programu.

0

Analiza pdf to prawdziwy hardcore. Istnieją biblioteki, które potrafią wyciągnąć dużo informacji z pdf, jednak zwykle jest to tekst i obrazki, czasem ze współrzędnymi, rzadko z właściwymi. Wiem co piszę, męczyłem się przez dwa miesiące testując trzy biblioteki usiłując wyciągnąć z pdf pewne formularze wraz z ich treścią. Większość tych bibliotek wymaga dużej wiedzy na temat budowy pdf, który ma opinię kosmicznie skomplikowanego formatu (podobnie jak psd - niech żyje Adobe, hura hura hura!).
Przetworzenie pdf do excela wymaga albo olbrzymiej ilości pracy i czasu, albo olbrzymiej wiedzy. Jeśli umiesz programować to nawet nie zabieraj się za to, poszukaj kogoś, kto ma doświadczenie w pracy z parsowaniem pdf i dobrze mu zapłać.

edit: może któryś program z tej listy częściowo spełni Twoje wymagania: http://desktoppub.about.com/od/pdfextractionsofware/PDF_Extraction_Software.htm

0

Ale właśnie, czy to muszą być pdfy? Raporty na gpw.pl są w formie tekstowej, takie coś dużo łatwiej by się analizowało. Wtedy jedyne co musiałbyś poznać to VBA + HTTP.

0

Nie ma żadnego api/webserwisu do zaciągania tych danych? DZiwne.

1 użytkowników online, w tym zalogowanych: 0, gości: 1