Tokenizacja plików źródłowych.

0

Witam wszystkich.
Poszukuję wszelkich informacji na temat możliwości tokenizacji plików źródłowych (konkretnie plików źródłowych java) w celu ich późniejszego przetworzenia, aby z kolei później móc poddać je analizie podobieństwa ich zawartości.
Chodzi mi o to jak skutecznie, efektywnie i w miarę prosto dokonywać takiego procesu. Zależy mi bardziej na informacjach źródłowych, tytułach książek itp.
Piszę pracę i nie proszę o jej napisanie, a o wskazanie sensownych źródeł.

Pozdrawiam
Michał

1

Hasło: lekser.

Jeśli chcesz porównywać AST (Abstract Syntax Trees) to do ich zbudowania użyj np ANTLR.

1 użytkowników online, w tym zalogowanych: 0, gości: 1