Парсинг html регулярными выражениями - C#

Узнай цену своей работы

Формулировка задачи:

Хочу пропарсить html документом регулярками. Вот документ :
<!--/noindex--></div></div></div></div></div><div class="b-section"><div class="b-forecast">
    <h1>Погода в <a href="" class="dotted" data-weathercode="26850">Минске</a></h1><div class="b-modes m-media"><ul class="b-modes-list"><li class="b-mode__li">
<a class="b-mode-i" href="http://pogoda.tut.by/set.php?city_id=26850">Запомнить</a></li></ul></div>
    <ul class="b-modes-list no_change" id="showMichalok">
        <li class="b-mode__li active"><a class="b-mode-i" data-toggle="tab" href="#tab-normal" id="normal">В ОБЫЧНОМ РЕЖИМЕ</a></li>
        <li class="b-mode__li"><a class="b-mode-i" data-toggle="tab" href="#tab-michalok" id="michalok">С МИХАЛКОМ</a></li>
    </ul>
    <div class="tab-content tab-michalok m-flex">
        <div id="tab-normal" class="b-fcurrent active  tab-pane"><table class="b-fcurrent__t" width="100%" border="0" cellspacing="0" cellpadding="0"><tr>
            <td class="fcurrent-top"><div class="fcurrent-aside"><div class="fcurrent-h">Сейчас</div></div>
<div class="fcurrent-i"><div class="fcurrent-c"><div class="fcurrent-temp">
<img class="forecast-icon" width="64" height="64" src="http://img.tyt.by/i/by4/weather/128/d/35.png" data-retina-src="http://img.tyt.by/i/by4/weather/128/d/35.png" alt="пасмурно, снег"/>
<span class="temp-i">-6&deg;</span></div>
<div class="fcurrent-descr">пасмурно, снег</div></div>
<div class="fcurrent-detail"><div class="detail-i"><span style="display:block">Ощущается -7&deg;<br /></span>Влажность 88 %
<br/><span style="display:none">Давление 765 мм рт. ст</span></div>
<div class="detail-i"><span style="display:block">Давление 765 мм рт. ст<br /></span>Ветер 
<img class="direction-icon icon-nw" src="http://img.tyt.by/i/by4/weather/i/1x1.gif" width="8" height="9" alt="CЗ" /> CЗ 1 м/c<span  style="display: none;" >, порывы 0 м/c</span></div></div></div>
</td>
Мне нужно вытащить
<div class="fcurrent-descr">пасмурно, снег</div></div>
Я пробовал так :
string tag = @"<\s*\w*\s*\w*\W*\w*\W*>[\w*]*";
Не получается(( Может подскажете код регулярных что бы вытащить эту строку.

Решение задачи: «Парсинг html регулярными выражениями»

textual
Листинг программы
            string input = @"<div class=""fcurrent-descr"">пасмурно, снег</div></div>";
            string pattern = @"<div class=""fcurrent-descr"">(.+)</div></div>";
            string result = Regex.Match(input, pattern).Groups[1].Value;

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

12   голосов , оценка 3.917 из 5