Jak sprawdzić w jakiej stronie kodowej zapisany jest plik

0

Jak sprawdzićw jakiej stronie kodowe jzapisany jest plik (kodowanie utf-8 ...). Nie chodzi mi o pliki html czy xml bo te mają to zdeklarowane w nagłówkach. Chodzi o zwykłe pliki teksowe (albo binarne).

0

Niektóre edytory w plikach UTF wstawiają na początku charakterystyczne 3 bajty (tak zwany Byte Order Mark). I on właśnie służył kiedyś do rozpoznawania dokumentów w UTF-8.

0

Najlepiej ręcznie, jeśli programowo to musisz niestety odczytać tekst i spróbować go skojarzyć z konkretnymi wartościami znaków, czy wystepują charakterystyczne ..... w różnych stronach kodowych literka ą ma różny kod ASCII i przy odrobinei szcześcia odnajdziesz tylko jeden kod odpowiadający za a pochodzacy z konkretnej strony kodowej np ISo-...-2. Jak rozpatrzysz więcej liter "polskich" to masz większą pewność że klasyczny plik należy do strony konkretnej kodowej. Np. Win1250 - 3 potencjalne literki, UTF-8 - 2 (z unikodem mogą być problemy ze względu na inną reprezentację znaku, musiałbyś brak pod uwagę kilka literek z rzędu) ISo-...-2 25 literek. Z dużym pradopodobieństwem to jest ISO-...-2

1 użytkowników online, w tym zalogowanych: 0, gości: 1