Czesc,
Mam porblem z poprawnym wyswietlaniem polskich znakow w python. Plik txt, z ktorego chce wcytac liste slow, jest kodowany w ANSI.
W kodzie pythona, mam wpisana na poczatku polecenie:
#-*- coding: utf-8 -*-
Dane wczytuje poprzez:
set_rzecz = set()
for wiersz in open('slowa.txt', 'r'):
slowo = wiersz[:-1]
set_rzecz.add(slowo.lower())
po wyswietleniu elementow zbioru set_rzecz pojawiaja sie np. ko�lawiej�cemu
Temat polskich znakow byl juz wielokrotnie walkowany. Probowalem robic przekodowanie na UTF-8, np. poprzez dodanie
slowo.decode("utf-8")
ale pojawia sie blad UnicodeDecodeError: 'utf8' codec can't decode byte 0xf3 in position 6: unexpected end of data