Pilnię potrzebuje kilku danych

Potrzebuje ile bajtów zajmują takie znaki:
ą
ś
ć
ź
ż
ł
ó
ń
ę

W kodowaniu znaków ISO i UTF-8

Jak się nie mylę jest coś w tym stylu ale już nie pamiętam
Chr(161)

W Latin-2 zajmują jeden bajt, w UTF-8 zajmują dwa.

ISO mam. Teraz pytanko czy te:
260 262 280 321 323 211 346 377 379 261 263 281 322 324 243 347 378 380

to są z UTF-8 ?

UTF-8 lub UTF-16, bo to 2 bajty są.

Inaczej.

Generalnie są 2 grupy kodowania znaków:

ANSI - Każdy znak ma 1 bajt. Znaki o kodach 0-127 to znaki ASCII - zawsze takie same znaki jak alfabet, cyfry, znaki przestankowe, znaki kontrolne. Pozostałe znaki (128-255) zależą od wybranej strony kodowej. Np. w kodowaniu ISO-8859-2 (tzw. "Latin-2" - łacińskie 2) lub Windows-1250 zawierają one znaki środkowoeuropejskie, w tym znaki polskie.
Unicode - Każdy znak może mieć od jednego do kilku bajtów. Unicode wprowadzono aby wyeliminować zamieszanie ze stronami kodowymi. Teraz 1 bajt już nie jest ograniczeniem i w jednym znaku można zapisać dowolny znak narodowy, ale również inne znaczki jak trójkąciki, buciki, strzałeczki, całeczki...
W UTF8 znaki ASCII są zapisywane tak samo jak w ANSII - na jednym bajcie i mają takie same kody. Jeśli pierwszy bajt znaku jest większy od 127 to wtedy jest to dłuższy znak, zajmuje 2 lub więcej bajtów. Znaki polskie w UTF8 zajmują po 2 bajty. Jednak każdy znak można zapisać na wiele sposobów, na różnej ilości bajtów.
W programowaniu łańcuchy Unicode (WideString w Delphi, ustring w C++, wchar_t* w C, string w C# i Java) używają jednej z odmian UTF-16, gdzie każdy znak zapisywany jest na 2 bajtach.

jakiś ładny kawałek FAQa można z tego zrobić

Zauważyłem że adf88 sumiennie pomaga na tym forum !
Gratulacje i dziękuje !

PTwr dobra myśl xD Na pewno będzie kilku takich jak ja xP

Liczba odpowiedzi na stronę