Regex, исключение подстроки - C#

Узнай цену своей работы

Формулировка задачи:

Добрый день! Помогите составить регулярку, пожалуйста. Есть у меня теги:
<td><a href="sample.ru"><img border="0" src="nav_next.gif" width="100" height="26" alt=""><br><strong>Следующая</strong></a></td>
 
<div id="navbar" style="margin:4px 0;text-align:center"><a href="sample.ru">Следующая страница&nbsp;»</a></div>
И так далее, их несколько вариантов. Из них мне необходимо каждый раз извлекать sample.ru. И, как мне кажется, у всех общая схожесть в a href="(.*?)" и слово "Следующая". Как мог составил регулярку: <a href="(.*?)"(.*?)Следующая Но она выделяет текст не от первого слева от слова "Следующая" тега <a href=, а от самого первого в документе тега <a href=. Подскажите, как указать чтоб парсилось первое вхождение <a href= слева от слова "Следующая" ? Заранее благодарен за помощь.
Дополню что для поиска задаются не только строки с этими тегами. Найти мне нужно результат из целой хтмл странички, в которой встречаются разные типы таких вот тегов.

Решение задачи: «Regex, исключение подстроки»

textual
Листинг программы
string pattern = @"(?<=<a href=.)\w+\.\w{2,4}(?=.>)"

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

6   голосов , оценка 4.167 из 5