Wiem że Python zapewnia bezproblemowe wsparcie dla Utf-8, Unicode - zarówno w shellu konsoli i domyślnie w zapisie, odczycie, c++ to tragedia w tym względzie. Nawet edukatorzy c++ unikają tematu i wydają książki oczywiście bez polskich ogonków i innych nich ASCI kodowań. Ale chciałem zapytać jakie języki ułatwiają i umożliwaiją bezproblemową (błyskawiczną) obsługę kodowań w jakimkolwiek języku. Przy pisaniu aplikacji wielojęzycznych ma to znaczenie oczywiście.
0
3
Java wewnętrznie trzyma stringi jako UTF-16 więc może pracować z dowolnymi znakami i można sobie praktycznie dowolnie z takiego stringa robić .getBytes(kodowanie)
albo z bajtów robić new String(bajty, kodowanie)
2
Python 3
2
Go używa pod spodem UTF-8, ale typ odpowiadający pojedyńczemu znakowi (rune) jest 32-bitowym int'em - czyli potrafi trzymać jeden znak UTF-32. Nie ma lepszej implementacji do pracy z chińskimi znaczkami.
Wszystkie implementacje bazujące na UTF-16 mają to do siebie że wiele dziwnych znaków będzie traktowane jako dwa char'y:
0
Wydaje mi się, że (oprócz Pythona3) Rust nie ma problemów z kodowaniami. I załatwia to w bardzo porządny i przemyślany sposób (jak to Rust).