Stworzenie programu w Javie, który odczytuje pliki z roszerzeniem eml, a następnie przeszukuje po zawartości w wiadomościach.

0

Witam :)

Mam problem i od kilku dni nie potrafie sobie z nim poradzic. Otrzymałem na studiach projekt do zrobienia w Javie, który wczytuje dużą ilość plików z rozszerzeniem eml (wiadomości z poczty outlook), wypisuje z tej poczty: nadawce, odbiorce, godzina wysłania, numer ip i zapisuje do plików tekstowych. Następnie będzie wyszukiwanie po tych plikach tekstowych.

Pomyślałem, żeby połączyć java z apache, z dokumentacji wychodzi, że potrafi czytać pliki eml i niby wszystko ładnie pięknie. Znalazłem kod, który to umożliwia

http://svn.apache.org/viewvc/poi/trunk/ ... 00&view=co

Tutaj mam problem, bo nie wiem w jakie pole wpisać skąd ma te pliki eml pobierać, bo tam żadnej ścieżki w tym kodzie nie ma.
Po skompilowaniu kodu w programie eclipse neon wyskakuje

No files names provided

Nie wiem co z tym zrobić a muszę część projektu wysłać do końca tego miesiąca :(
Jakby ktoś jakoś pomógł, byłbym bardzo wdzięczny a nawet jakby ktoś bardzo się zaangażował jestem w stanie zapłacić.

Pozdrawiam :)

2

Nie przejmuj się, weźmiesz warunek, nauczysz się i zdasz za rok :)

0

Dziekuje, ake to nie wchodzi w gre xD

0

A te pliki eml to nie jest jakiś plaintext w xmlu tak w ogóle?

0

Znalazłem, że plik eml ma zgodność z normami nagłówki poczty elektronicznej lub w inny sposób znany jako RFC 822.
https://msdn.microsoft.com/en-us/library/ms527253(v=exchg.10).aspx

0

Pliki eml musisz raczej po prostu dostać, bo z tego co wiem jest to format transportowy a nie przechowywania.
Czyli kilka programów eksportuje do tego formatu a Ty możesz sobie takie pliki wczytać z dysku.

Format eml wspiera np. przy zapisie także Thunderbird.

0

@toniek-94 no dobra geniuszu, ale skoro to plaintext to po co ci w ogóle jakieś biblioteki do "parsowania" tego? :D Przecież to można rozpakować jednym regexem... Cały ten twój kod można by pewnie upakować w 30 linijek.

0

Nie bardzo Ciebie Shalon rozumiem, jestem dno z programowania, bo to nie moja specjalizacja :) Wymyśliłem sobie, żeby po prostu użyć apacha do odczytu tych plików i z tym próbuje jakoś kombinować. Nie wiem tylko czy ide w dobrym kierunku. Zależy mi na odczycie plików eml i później żebym miał możliwość przeszukiwania w tych plikach eml , typowo jaki nadawca, który mail.

Ogólnie dziękuje Panowie za poświęcony czas nad tym tematem :)

0

Z tego co piszą na wiki to .eml to zwykły tekst wiec wczytujesz go File i potem scannerem albo czymś możesz po nim jeździć szukając co chcesz

0

Już tak kombinowałem i tak właśnie ma nie być (oddałem taką pierwszą wersje projektu), apka ma umożliwiać pobranie całego folderu gdzie jest ileś plików eml i wtedy robić przeszukiwania

0

No ale co to za problem wczytać wszystkie pliki z katalogu i sobie te dane jakoś trzymać sensownie w pamięci? Nijak tu ten Apache POI nie pomaga w żaden sposób. POI to jest fajna biblioteka, ale pasuje tu jak pięść do nosa. To jest biblioteka której sie uzywa jak masz do wczytania milion plików z tysiącem różnych formatów.
Zresztą bardzo często użycie "gotowca" jest dużo trudniejsze niż gdybyś po prostu napisał to sam, co zresztą widać na załączonym obrazku.

Serio, weź warunek i ucz się kolejny rok, bo teraz to nic z tego nie będzie. Z pustego stosu to i Salomon nie zdejmie.

0

Serio to nie moge wziąć warunka bo jestem na finiszu studiów i nawet nie przejdę do ostatniego semestru. Programowanie to nie moja brocha, bo mam inna specjalizacje, ale tutaj trafił się taki przedmiot i mam pod górkę :( Na prawdę dziękuje Shalom za rady, bo już się coś mniej więcej dowiedziałem, ale z tym warunem to odpada totalnie. Dziękuje też innym za kombinowanie w tym temacie. Może ktoś coś więcej pomoże ? na to jednak liczę :)

1

A może taka biblioteka jak JavaMail ci pomoże?
https://www.google.com/search?q=java+search+in+eml+file

1 użytkowników online, w tym zalogowanych: 0, gości: 1