Które języki programowania zapewniają błyskawiczną i bezproblemową implementację w kodowaniu Utf-8, Unicode, Utf-16, 32

0

Wiem że Python zapewnia bezproblemowe wsparcie dla Utf-8, Unicode - zarówno w shellu konsoli i domyślnie w zapisie, odczycie, c++ to tragedia w tym względzie. Nawet edukatorzy c++ unikają tematu i wydają książki oczywiście bez polskich ogonków i innych nich ASCI kodowań. Ale chciałem zapytać jakie języki ułatwiają i umożliwaiją bezproblemową (błyskawiczną) obsługę kodowań w jakimkolwiek języku. Przy pisaniu aplikacji wielojęzycznych ma to znaczenie oczywiście.

3

Java wewnętrznie trzyma stringi jako UTF-16 więc może pracować z dowolnymi znakami i można sobie praktycznie dowolnie z takiego stringa robić .getBytes(kodowanie) albo z bajtów robić new String(bajty, kodowanie)

2

Python 3

2

Go używa pod spodem UTF-8, ale typ odpowiadający pojedyńczemu znakowi (rune) jest 32-bitowym int'em - czyli potrafi trzymać jeden znak UTF-32. Nie ma lepszej implementacji do pracy z chińskimi znaczkami.

Wszystkie implementacje bazujące na UTF-16 mają to do siebie że wiele dziwnych znaków będzie traktowane jako dwa char'y:
screenshot-20210529085133.png

0

Wydaje mi się, że (oprócz Pythona3) Rust nie ma problemów z kodowaniami. I załatwia to w bardzo porządny i przemyślany sposób (jak to Rust).

1 użytkowników online, w tym zalogowanych: 0, gości: 1