Regex, исключение подстроки - C#
Формулировка задачи:
Добрый день! Помогите составить регулярку, пожалуйста. Есть у меня теги:
И так далее, их несколько вариантов. Из них мне необходимо каждый раз извлекать sample.ru. И, как мне кажется, у всех общая схожесть в a href="(.*?)" и слово "Следующая". Как мог составил регулярку: <a href="(.*?)"(.*?)Следующая
Но она выделяет текст не от первого слева от слова "Следующая" тега <a href=, а от самого первого в документе тега <a href=. Подскажите, как указать чтоб парсилось первое вхождение <a href= слева от слова "Следующая" ? Заранее благодарен за помощь.
<td><a href="sample.ru"><img border="0" src="nav_next.gif" width="100" height="26" alt=""><br><strong>Следующая</strong></a></td> <div id="navbar" style="margin:4px 0;text-align:center"><a href="sample.ru">Следующая страница »</a></div>
Дополню что для поиска задаются не только строки с этими тегами. Найти мне нужно результат из целой хтмл странички, в которой встречаются разные типы таких вот тегов.
Решение задачи: «Regex, исключение подстроки»
textual
Листинг программы
string pattern = @"(?<=<a href=.)\w+\.\w{2,4}(?=.>)"
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д