При парсинге таблицы не видит значения ячеек [requests, lxml] - Python
Формулировка задачи:
Здравствуйте. Пытаюсь получить значения ссылок на праздники с этого сайта Использую lxml, requests
Этот строка кода всегда возвращает пустой список
Выборка селекторов таким css "a[href^='/holidays/']" получает слишком много ссылок. Также использовал xpath, но результат не возвращает хотя в браузере все подчеркивает. Почему не возвращает селекторы при выборке, хотя точно должен возвращать ? Помогите пожалуйста решить данную проблему.
Спасибо!
Листинг программы
- def get_holidays(country_item):
- session = requests.Session()
- getPage = session.get(country_item['href'])
- pageHtml = html.fromstring(getPage.text)
- getAllBlock = pageHtml.cssselect(".holidayweek>table>tbody>tr>td>ul>li>a")
- lists = []
- for item in getAllBlock:
- href = 'http://www.calend.ru/' + item.attrib['href']
- title = item.text
- country = country_item['coutry']
Листинг программы
- getAllBlock = pageHtml.cssselect(".holidayweek>table>tbody>tr>td>ul>li>a")
Решение задачи: «При парсинге таблицы не видит значения ячеек [requests, lxml]»
textual
Листинг программы
- import requests
- from lxml import html
- page = requests.get('http://www.calend.ru/holidays/belorus/')
- tree = html.fromstring(page.content)
- dates = [x.text for x in tree.cssselect('.holidayweek tr td:nth-child(1) > a')]
- names = [x.text for x in tree.cssselect('.holidayweek tr td:nth-child(2) > ul > li > a')]
- links = [x.get('href') for x in tree.cssselect('.holidayweek tr td:nth-child(2) a')]
- for date,name,link in zip(dates, names, links):
- print("{} :: {} :: {}".format(date.strip(), name.strip(), "http://www.calend.ru/"+link.strip()))
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д