kodowanie polskich znaków

Witam, wysyłam na serwer polskie znaki, jednak są widziane w stringu jako śmieć. Poniżej kawałek kodu gdzie pobieram bajt i zapisuje do stringa

 String    s = System.Text.Encoding.UTF8.GetString(b);

Wysyłam np. litere ł - kod w UTF8 to c5, w bajcie poprawnie widzę wartość c5 jednakże do stringa nie przypisuje się litera ł tylko śmieć. W czym może być problem ??

no ale czym jest b?

No i gdzie wyświetlasz to s?

b jest tablicą bajtów 1 znakową, czytam znak po znkau

 byte[] b=new byte[1]

a s to string, podglądam go na debugerze i widze krzaki a wyświetlam w richTextBox

Hmm a mi się coś wydawało że UTF-8 jest kodowane na dwóch bajtach

http://www.utf8-chartable.de/unicode-utf8-table.pl?start=256
U+0142 ł c5 82 LATIN SMALL LETTER L WITH STROKE

UTF-8 jest kodowaniem o zmiennej długości, od 1 do 4 bajtów na znak.

Liczba odpowiedzi na stronę

kodowanie polskich znaków

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami