Регулярное выражение - Python
Формулировка задачи:
Здравствуйте.
Нужно из всего html кода выделить одну строку. <span class="post__time_published">сегодня в 10:47</span>
Нужна только дата и время. Больше ничего.
Пробовал так,ничего не получается(удаляет всё):
Версия Python: 2.7.11
Подскажите пожалуйста как сделать.
Спасибо!
Листинг программы
- response = urllib2.urlopen(address)
- html=response.read()
- pattern=re.compile(r'.*?[^<span class="post__time_published">.*?</span>]',re.DOTALL)
- html=re.sub(pattern,' ',html)
Решение задачи: «Регулярное выражение»
textual
Листинг программы
- >>> import re
- >>> string = '<span>...</span><span class="post__time_published">DATE OR TIME TO EXTRACT</span><span>...</span>'
- >>> pattern = re.compile(r'<span class="post__time_published">(.*?)</span>')
- >>> pattern.search(string).group(1)
- 'DATE OR TIME TO EXTRACT'
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д