Знатоки супа и регулярок подскажите - Python
Формулировка задачи:
хочу распарсить в целях тренировки сайт с вакансиями, сразу импортирую нужные модули
затем смотрю названия вакансии и исходный код странички, и выходит вот такая строка
нужно мне название, думал просто найти все h2 , но она забирает и цену, вобщем не красиво , не beautifull, думаю найти по регуляркам
пусто, ничего не нашло, вопрос, почему в names не поместилось "Программист Python".thanks.
Решение задачи: «Знатоки супа и регулярок подскажите»
textual
Листинг программы
import requests from bs4 import BeautifulSoup page = requests.get('http://www.work.ua/jobs/1801141/') tree = BeautifulSoup(page.content, 'lxml') print(tree.find('h1', {'id': 'h1-name'}).text) table = tree.find('dl', {'class': 'dl-horizontal'}) dts = table.find_all('dt') dds = table.find_all('dd') for t, d in zip(dts, dds): if d.find('a'): d = d.find('a') print('{} {}'.format(t.text.strip(), d.text.strip()))
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д