Работа с HTML документами - Python

Узнай цену своей работы

Формулировка задачи:

1 осматривается два html документа (a и b). из а в b можно перейти за один переход, если в a-док есть ссылка(<a href="b">) из a-док можно перейти в b за два перехода, если в а-док есть переход на документ с, а в с-док есть переход в b Задача: на вход подаются две строки,содержащие url двух документов(а и b) выведите ДА, если из а-док в b-док можно перейти за два перехода, иначе НЕТ 2 на вход подается ссылка на html файл необходимо скачать этот файл, найти все ссылки вида <a href> и вывести список сайтов, на которые есть ссылка -сайтом в данной задаче будет считаться имя домена если будет ссылка на ftp, то это не считается , и ссылка должна быть полной

Решение задачи: «Работа с HTML документами»

textual
Листинг программы
  1. # -*- coding: utf-8 -*-
  2. import re
  3. import requests
  4.  
  5. url = 'https://ya.ru'
  6. text = requests.get(url).text
  7. ls = re.findall(r'''<a href=['"](.*?)['"]''', text)
  8.  
  9. sites = set()
  10. for i in ls:
  11.     bit = i.split('//')
  12.     if bit[0] != 'ftp:':
  13.         sites.add(bit[1])
  14. print('\n'.join(sites))

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

10   голосов , оценка 4.2 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут