Как выудить необходимы данные при парсинге - Python
Формулировка задачи:
Добрый день
Мне необходимо спарсить данную страницу https://students.bmstu.ru/schedule/list так, чтобы после завершения работы программы, она оставляла тебе файл с названием группы (Например ИУ2-21) и ссылку на расписание этой группы
Я дошел до того момента, что программа мне выдает все группы и все ссылки на них в HTML формате, но мне нужно это все оформить в виде читабельных данных
Я был бы очень признателен, если кто-то помог бы мне дописать эту программу.
Заранее благодарен неравнодушным
Листинг программы
- import requests
- import urllib.request
- from bs4 import BeautifulSoup
- def get_html(url):
- response = urllib.request.urlopen(url)
- return response.read()
- def parse(html):
- soup = BeautifulSoup(html)
- table = soup.find('div',class_="list-group accordion")
- gr = table.find_all('', class_ = "btn btn-sm btn-default text-nowrap")
- print(gr)
- def main():
- parse(get_html('https://students.bmstu.ru/schedule/list'))
- if __name__ == "__main__":
- main()
Решение задачи: «Как выудить необходимы данные при парсинге»
textual
Листинг программы
- def parse(html):
- soup = BeautifulSoup(html, "html.parser")
- table = soup.find('div',class_="list-group accordion")
- gr = table.find_all('', class_ = "btn btn-sm btn-default text-nowrap")
- for link in gr:
- print(re.sub(r'\s+', ' ',link.get_text().strip()) + ' ' + link.attrs["href"])
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д