Работа с HTML документами - Python
Формулировка задачи:
1
осматривается два html документа (a и b). из а в b можно перейти за один
переход, если в a-док есть ссылка(<a href="b">)
из a-док можно перейти в b за два перехода, если в а-док есть переход
на документ с, а в с-док есть переход в b
Задача: на вход подаются две строки,содержащие url двух документов(а и b)
выведите ДА, если из а-док в b-док можно перейти за два перехода, иначе НЕТ
2
на вход подается ссылка на html файл
необходимо скачать этот файл, найти все ссылки вида <a href>
и вывести список сайтов, на которые есть ссылка
-сайтом в данной задаче будет считаться имя домена
если будет ссылка на ftp, то это не считается , и ссылка должна быть полной
Решение задачи: «Работа с HTML документами»
textual
Листинг программы
# -*- coding: utf-8 -*- import re import requests url = 'https://ya.ru' text = requests.get(url).text ls = re.findall(r'''<a href=['"](.*?)['"]''', text) sites = set() for i in ls: bit = i.split('//') if bit[0] != 'ftp:': sites.add(bit[1]) print('\n'.join(sites))
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д