При парсинге таблицы не видит значения ячеек [requests, lxml] - Python
Формулировка задачи:
Здравствуйте. Пытаюсь получить значения ссылок на праздники с этого сайта Использую lxml, requests
Этот строка кода всегда возвращает пустой список
Выборка селекторов таким css "a[href^='/holidays/']" получает слишком много ссылок. Также использовал xpath, но результат не возвращает хотя в браузере все подчеркивает. Почему не возвращает селекторы при выборке, хотя точно должен возвращать ? Помогите пожалуйста решить данную проблему.
Спасибо!
Решение задачи: «При парсинге таблицы не видит значения ячеек [requests, lxml]»
textual
Листинг программы
import requests from lxml import html page = requests.get('http://www.calend.ru/holidays/belorus/') tree = html.fromstring(page.content) dates = [x.text for x in tree.cssselect('.holidayweek tr td:nth-child(1) > a')] names = [x.text for x in tree.cssselect('.holidayweek tr td:nth-child(2) > ul > li > a')] links = [x.get('href') for x in tree.cssselect('.holidayweek tr td:nth-child(2) a')] for date,name,link in zip(dates, names, links): print("{} :: {} :: {}".format(date.strip(), name.strip(), "http://www.calend.ru/"+link.strip()))
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д