Problem z kodowaniem

0

Mam taki problem:
Sczytuje z pliku zakodowanego w UTF-8 Stringi i porównuje je w porogramie np: w pliku mam słowo "Kraków", ale metoda inputString.equals("Kraków") zwraca false. Po wyprintowaniu tego Stringa wejściowego wyświetla mi się: "Kraków". Pytanie moje jest takie: czy mogę wyfiltrować wszystkie "niepożądane" znaki z wejściowego Stringa tak żeby został "Kraków" bez względu na kodowanie?. Jak wywale wszystkie znaki niezgodne z UTF-8 to wywali mi też "ó" a tego nie chcę. Chciałbym żeby filtr przepuszczał polskie znaki jak również niemieckie (typu "ö") a resztę wywalał. Z góry dzięki:)

0

Czy ten Kraków to jest pierwszy wyraz w pierwszej linijkce w pliku? Wyglada na BOM, poczytaj o tym. Dodaje to np windows notatnik, ale da sie wylaczyc.

0

Staraj się unikać zapisu polskich znaków w plikach java. Lepiej zapisać to za pomocą znaków unicode. Dzięki temu będzie to działać zawsze niezależnie od kodowania plików java.

inputString.equals("Krak\u00F3w")

0

@up: a dlaczego? Jak plik zostanie zapisany w kodowaniu ktore wspiera taki znak, to zostanie to poprawnie skompilowane. To czy wspiera czy nie dowiesz sie wklepujac dany znak. Po kompilacji jeden pies. Twoj kod nie zmienia kompletnie nic, pomiajajac ze wyglada jak kupa na srodku pokoju.

1 użytkowników online, w tym zalogowanych: 0, gości: 1