Dozwolone bajty w znakach UTF8.

0

Widziałem że np znak to e2 82 ac, czyli w dziesiętnym to 226 130 172.

I tak się zastanawiam, nie wiem też gdzie tego szukać ://

Czy są jakiekolwiek znaki w utf8 które mają którąś z tych liczb (bajtów) mniejszą niż 128? Np jest znak 226 120 172? (tzn takiego akurat nie ma, sprawdziłem walidatorem utf8), Wydaje mi się że nie ma takich, bo by się pomyliły ze znakami ASCII, np znak 226 13 to nie wiadomo by było czy to jeden znak utf8 czy jeden znak 226 i enter.

Ktoś pomoże?

4

Czy są jakiekolwiek znaki w utf8 które mają którąś z tych liczb (bajtów) mniejszą niż 128?

Nie ma takich znaków - https://en.wikipedia.org/wiki/UTF-8#Description, podpunkt Backwards compatibility.

1

W skrócie: bajty od 0-127 to jest po prostu ASCII. Sekwencje wielobajtowe zawierają wyłącznie bajty 128-255.

Podany przez ciebie przykład 226 120 172 jest nieprawidłowy, bo ani 226 nie może stanowić samodzielnie znaku, ani 120 nie może wystąpić jako część kilkubajtowej sekwencji.
To samo z 226 13.

1 użytkowników online, w tym zalogowanych: 0, gości: 1