Парсинг HTML с помощью регулярных выражений - C#
Формулировка задачи:
имеем строку(вернее табличку):
Как вытащить из неё инфу? Тоесть "тип сообщения", "о смоимости чистых активов", Юр лицо и т.п.?
Можно в массив или список. подскажите.
Листинг программы
- <table class="mesview" ><tr><td>Тип сообщения</td><td>О стоимости чистых активов</td></tr><tr class="bluetr"><td>Юридическое лицо</td><td>ЗАО АК "ЛАЙТ ЭЙР" (ИНН 0278070787, ОГРН 1030204615088)</td></tr><tr><td>Юридический адрес (по данным ЕГРЮЛ)</td><td>450501, Башкортостан Респ, Уфимский р-н, Булгаково с, 1, 1</td></tr><tr class="bluetr"><td>Отчетная дата</td><td>31.03.2014</td></tr><tr><td>Дата расчёта</td><td>30.04.2014</td></tr><tr class="bluetr"><td>Стоимость чистых активов, руб.</td><td>28 047 000,00</td></tr></table><br/><b >Текст сообщения:</b><div ><pre class="message-text">Стоимость чистых активов ЗАО АК "Лайт Эйр" по состоянию на 31.03.2014 года составляет 28 047 000 рублей 00 коп.</pre></div>
Решение задачи: «Парсинг HTML с помощью регулярных выражений»
textual
Листинг программы
- public static List<string> TakeTableRow(string source_html) // Вытаскивает сообщения из таблицы
- {
- List<string> rows = new List<string>();
- string pattern = "<td>(.*?)</td>";
- MatchCollection matches = Regex.Matches(source_html, pattern);
- foreach (Match match in matches)
- {
- string res = match.ToString().Replace("<td>", "").Replace("</td>", "");
- rows.Add(res);
- }
- return rows;
- }
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д