Tokenizacja plików Java.

0

Witam wszystkich.
Chciałbym podjąć się tokenizacji plików źródłowych Java w celu ich porównywania. Chciałbym zapytać czy któryś z was działał coś w tym temacie bardziej profesjonalnie i czy zrealizował swoje cele. Czy łatwiejszym sposobem na poprawną analizę plików źródłowych nie jest napisanie parsera?
Pozdrawiam
Michał

0

Do zamiany plików źródłowych na drzewka (Abstract Syntax Trees) są odpowiednie programy i jest ich cała masa. Generalnie dla (prawie?) każdego języka jest odpowiednia gramatyka dla pewnego parsera i leksera (czasem parser i lekser są w jednym programie). Szukaj w Google pod hasłem np: "java grammar", "antlr java grammar", np: https://github.com/antlr/grammars-v4/blob/master/java/Java.g4 Parsowaniem zajmowałem się tylko na studiach i nawet wiele nie zdziałałem w tym temacie, więc praktycznych rad raczej nie jestem w stanie podać.

Materiały nt parsowania to np:
http://wazniak.mimuw.edu.pl/index.php?title=Podstawy_kompilatorów

Jeśli chodzi o porównywanie plików w celu znalezienia plagiatów to na moim wydziale było to zaimplementowane w sprawdzarkach do zadań z algorytmów. Nie pamiętam kto to robił ale prawie na pewno ktoś z: http://www.tcs.uj.edu.pl

1 użytkowników online, w tym zalogowanych: 0, gości: 1