Ошибка кодировки при чтении из файла - Python

Узнай цену своей работы

Формулировка задачи:

Добрый день, коллеги! Читаю локальный файл при помощи urllib
Листинг программы
  1. import urllib
  2. file_address="C:/work/stores/4067.html"
  3. file=urllib.request.urlopen("file:///" + file_address)
  4. soup=BeautifulSoup(file,"lxml")
  5. print(soup.prettify())
При этом весь русский текст превращается в тарабарский. Открываю локальный файл браузером и тоже тарабарский. Если открывать файл блокнотом, то всё нормально. В файле указана кодировка:
Листинг программы
  1. charset=windows-1251
Как добавить кодировку в
Листинг программы
  1. urllib.request.urlopen()
?

Решение задачи: «Ошибка кодировки при чтении из файла»

textual
Листинг программы
  1. import codecs
  2. fileObj = codecs.open( "someFilePath", "r", "cp1251" )
  3. soup = BeautifulSoup(fileObj)

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

8   голосов , оценка 4.125 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут
Похожие ответы