Парсинг сайта - C# (177939)
Формулировка задачи:
Имеется страница с примерно следующим содержимым
Хотелось бы получить то что находится между <b>*</b>
Пытался сделать так
... <div class="main random"> <b>1</b> <b>123</b> <b>12</b> <b>63</b> <b>52</b> </div> ... <div class="main random"> <b>112</b> <b>64</b> <b>86</b> <b>63</b> <b>52</b> </div> ...
private string Pars(string text)
{
var webClient = new System.Net.WebClient();
string html = webClient.DownloadString(text);
string pattern = @"(?<=<div class=""main random"">)(.*)(?=</div>)";
Regex regex = new Regex(pattern);
Match match = regex.Match(html.ToString());
string result = "";
while (match.Success)
{
result += match.Value;
match = match.NextMatch();
}
return result;
}Решение задачи: «Парсинг сайта»
textual
Листинг программы
foreach (HtmlAgilityPack.HtmlNode divNode in doc.DocumentNode.SelectNodes("//div[@class=\"main random\"]"))
{
foreach (HtmlAgilityPack.HtmlNode node in divNode.SelectNodes("b"))
{
string part = node.InnerText;
}
}