Парсинг HTML с помощью регулярных выражений - C#

Узнай цену своей работы

Формулировка задачи:

имеем строку(вернее табличку):
<table class="mesview" ><tr><td>Тип сообщения</td><td>О стоимости чистых активов</td></tr><tr class="bluetr"><td>Юридическое лицо</td><td>ЗАО АК "ЛАЙТ ЭЙР" (ИНН 0278070787, ОГРН 1030204615088)</td></tr><tr><td>Юридический адрес (по данным ЕГРЮЛ)</td><td>450501, Башкортостан Респ, Уфимский р-н, Булгаково с, 1, 1</td></tr><tr class="bluetr"><td>Отчетная дата</td><td>31.03.2014</td></tr><tr><td>Дата расчёта</td><td>30.04.2014</td></tr><tr class="bluetr"><td>Стоимость чистых активов, руб.</td><td>28 047 000,00</td></tr></table><br/><b >Текст сообщения:</b><div ><pre class="message-text">Стоимость чистых активов ЗАО АК "Лайт Эйр" по состоянию на 31.03.2014 года составляет 28 047 000 рублей 00 коп.</pre></div>
Как вытащить из неё инфу? Тоесть "тип сообщения", "о смоимости чистых активов", Юр лицо и т.п.? Можно в массив или список. подскажите.

Решение задачи: «Парсинг HTML с помощью регулярных выражений»

textual
Листинг программы
 public static List<string> TakeTableRow(string source_html) // Вытаскивает сообщения из таблицы
        {
            List<string> rows = new List<string>();
            string pattern = "<td>(.*?)</td>";
 
            MatchCollection matches = Regex.Matches(source_html, pattern);      
            foreach (Match match in matches)
            {
                string res = match.ToString().Replace("<td>", "").Replace("</td>", "");
                rows.Add(res);
            }
           
            return rows;
        }

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

11   голосов , оценка 4.364 из 5
Похожие ответы