Поиск по коду страницы теста по маске - C#

Узнай цену своей работы

Формулировка задачи:

Добрый день. Имеется приложение, которое через HtmlAgilityPack добывает себе ссылки на страницы, на которые потом необходимо зайти и найти в них определенный текст. С нахождением и заходом на страницы проблем нет, а вот с поиском текста по маске пока с ходу сделать не получилось. Получаем коллекцию нодов состоящих из ссылок:
Листинг программы
  1. HtmlAgilityPack.HtmlNodeCollection links = <получение линки>;
После чего идем по каждому элементу коллекции:
Листинг программы
  1. foreach (var item in links)
  2. {
  3. string site_link = item.ChildNodes[0].InnerText;
  4. try
  5. {
  6. var WebPage = new HtmlWeb();
  7. var WebPageDoc = WebPage.Load(site_link);
  8. <...>
  9. }
  10. catch { }
  11. }
Ну и собственно на месте <...> у меня пока заминка. Нужно брать исходный код каждой страницы и искать там текст определенного содержания, к примеру возьмем email. Подскажите, как правильно реализовать поиск текста по странице по заданной маске *@*.*, что бы дергало это слово целиком на странице(или несколько раз если их больше одного). И хотелось бы какое-нибудь решение, которое бы это делало не слишком долго, а то страниц более 150000...

Решение задачи: «Поиск по коду страницы теста по маске»

textual
Листинг программы
  1. var reg = new Regex(".*", RegexOptions.Compiled);

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

6   голосов , оценка 4.167 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут
Похожие ответы