Работа с HTML документами - Python

Формулировка задачи:

1 осматривается два html документа (a и b). из а в b можно перейти за один переход, если в a-док есть ссылка(<a href="b">) из a-док можно перейти в b за два перехода, если в а-док есть переход на документ с, а в с-док есть переход в b Задача: на вход подаются две строки,содержащие url двух документов(а и b) выведите ДА, если из а-док в b-док можно перейти за два перехода, иначе НЕТ 2 на вход подается ссылка на html файл необходимо скачать этот файл, найти все ссылки вида <a href> и вывести список сайтов, на которые есть ссылка -сайтом в данной задаче будет считаться имя домена если будет ссылка на ftp, то это не считается , и ссылка должна быть полной

Код к задаче: «Работа с HTML документами - Python»

textual
# -*- coding: utf-8 -*-
import re
import requests
 
url = 'https://ya.ru'
text = requests.get(url).text
ls = re.findall(r'''<a href=['"](.*?)['"]''', text)
 
sites = set()
for i in ls:
    bit = i.split('//')
    if bit[0] != 'ftp:':
        sites.add(bit[1])
print('\n'.join(sites))

10   голосов, оценка 4.200 из 5


СОХРАНИТЬ ССЫЛКУ