Кодировка - Python
Формулировка задачи:
Всем привет. Использую requests. Спарсил страничку сайта, пытаюсь записать в блокнот, и выдает ошибку:
Если применять метод .content, то все без ошибок, но в полученном результате вместо текста что-то вроде "x86\xd0\xb8". На сайте стоит кодировка UTF-8, в headers я задал часто того, что увидел в сниффере:
Как привести все это к нормальному, понятному виду?
Листинг программы
- Traceback (most recent call last):
- File "C:\Users\Глеб\Desktop\Python\my-requests.py", line 48, in <module>
- doc.write(str(content.text))
- File "C:\Users\Глеб\AppData\Local\Programs\Python\Python35\lib\encodings\cp1251.py", line 19, in encode
- return codecs.charmap_encode(input,self.errors,encoding_table)[0]
- UnicodeEncodeError: 'charmap' codec can't encode character '\u2192' in position 82737: character maps to <undefined>
Листинг программы
- 'Accept-Encoding': 'gzip, deflate',
Пробовал применять вдобавок метод .decode('UTF-8') - не помогло
Решение задачи: «Кодировка»
textual
Листинг программы
- r = requests.get('http://www.cyberforum.ru')
- with open('cyberforum.html','w',encoding=r.encoding) as f:
- f.write(r.text)
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д