zamiana \u.... na normalny string

0

Witam

W javie jestem początkujący, rozpocząłem pisanie programu, który ma obrabiać pewne dane.
Napotkałem jednak na pewien problem -pewnie banalny ale dla mnie od rana nie do przeskoczenia- w pliku generalnie jest tekst ale zamias polskich i innych narodowych szlaczków są ciągi np \u0142 itp.
Jak wczytać taki plik by znaki były "normalne"

Pozdrawiam

0

lekcja na dziś: unicode

0

czy może ktoś coś więcej podpowiedzieć ?

0

Musisz sobie napisać metodę do unescape'owania takich sekwencji unicode, albo znaleźć do tego bibliotekę (w apache commons jest chyba coś takiego).

Konwersja jest prosta: za każdym razem, kiedy napotykasz na ciąg \u, bierzesz 4 kolejne cyfry szesnastkowe i zamieniasz na char:

char znak = (char) Integer.parseInt(teCzteryZnaki, 16);

Gotowy znak dołączasz do stringa.

1 użytkowników online, w tym zalogowanych: 0, gości: 1