Работа с HTML документами - Python

Узнай цену своей работы

Формулировка задачи:

1 осматривается два html документа (a и b). из а в b можно перейти за один переход, если в a-док есть ссылка(<a href="b">) из a-док можно перейти в b за два перехода, если в а-док есть переход на документ с, а в с-док есть переход в b Задача: на вход подаются две строки,содержащие url двух документов(а и b) выведите ДА, если из а-док в b-док можно перейти за два перехода, иначе НЕТ 2 на вход подается ссылка на html файл необходимо скачать этот файл, найти все ссылки вида <a href> и вывести список сайтов, на которые есть ссылка -сайтом в данной задаче будет считаться имя домена если будет ссылка на ftp, то это не считается , и ссылка должна быть полной

Решение задачи: «Работа с HTML документами»

textual
Листинг программы
# -*- coding: utf-8 -*-
import re
import requests
 
url = 'https://ya.ru'
text = requests.get(url).text
ls = re.findall(r'''<a href=['"](.*?)['"]''', text)
 
sites = set()
for i in ls:
    bit = i.split('//')
    if bit[0] != 'ftp:':
        sites.add(bit[1])
print('\n'.join(sites))

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

10   голосов , оценка 4.2 из 5