Парсинг HTML с помощью регулярных выражений - C#
Формулировка задачи:
имеем строку(вернее табличку):
Как вытащить из неё инфу? Тоесть "тип сообщения", "о смоимости чистых активов", Юр лицо и т.п.?
Можно в массив или список. подскажите.
<table class="mesview" ><tr><td>Тип сообщения</td><td>О стоимости чистых активов</td></tr><tr class="bluetr"><td>Юридическое лицо</td><td>ЗАО АК "ЛАЙТ ЭЙР" (ИНН 0278070787, ОГРН 1030204615088)</td></tr><tr><td>Юридический адрес (по данным ЕГРЮЛ)</td><td>450501, Башкортостан Респ, Уфимский р-н, Булгаково с, 1, 1</td></tr><tr class="bluetr"><td>Отчетная дата</td><td>31.03.2014</td></tr><tr><td>Дата расчёта</td><td>30.04.2014</td></tr><tr class="bluetr"><td>Стоимость чистых активов, руб.</td><td>28 047 000,00</td></tr></table><br/><b >Текст сообщения:</b><div ><pre class="message-text">Стоимость чистых активов ЗАО АК "Лайт Эйр" по состоянию на 31.03.2014 года составляет 28 047 000 рублей 00 коп.</pre></div>
Решение задачи: «Парсинг HTML с помощью регулярных выражений»
textual
Листинг программы
public static List<string> TakeTableRow(string source_html) // Вытаскивает сообщения из таблицы { List<string> rows = new List<string>(); string pattern = "<td>(.*?)</td>"; MatchCollection matches = Regex.Matches(source_html, pattern); foreach (Match match in matches) { string res = match.ToString().Replace("<td>", "").Replace("</td>", ""); rows.Add(res); } return rows; }
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д