Ошибка кодировки при чтении из файла - Python
Формулировка задачи:
Добрый день, коллеги! Читаю локальный файл при помощи urllib
При этом весь русский текст превращается в тарабарский. Открываю локальный файл браузером и тоже тарабарский. Если открывать файл блокнотом, то всё нормально. В файле указана кодировка:
Как добавить кодировку в
?
Листинг программы
- import urllib
- file_address="C:/work/stores/4067.html"
- file=urllib.request.urlopen("file:///" + file_address)
- soup=BeautifulSoup(file,"lxml")
- print(soup.prettify())
Листинг программы
- charset=windows-1251
Листинг программы
- urllib.request.urlopen()
Решение задачи: «Ошибка кодировки при чтении из файла»
textual
Листинг программы
- import codecs
- fileObj = codecs.open( "someFilePath", "r", "cp1251" )
- soup = BeautifulSoup(fileObj)
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д